يعرض الباحث Antonio Javier Sutil Jiménez في هذا المقال أبرز البيانات حول الدراسة «التشخيص التفريقي لمسببات الخرف المعتمد على الذكاء الاصطناعي باستخدام بيانات متعددة النماذج».
لماذا تُعد دراسة الخرف والذكاء الاصطناعي (IA) مهمة؟
سكان العالم يشيخون وبالتالي نواجه مخاطر صحية متعددة مرتبطة بالعمر. أحد هذه المخاطر هو الخرف، حيث يزداد تشخيصه بنحو 10 ملايين حالة جديدة كل عام. تُعد أمراض الخرف مجموعة من الاضطرابات التي تتميز بتدهور الوظائف المعرفية إلى درجة تعيق أو تمنع الأنشطة اليومية بشكل مستقل. يبرز من بينها مرض الزهايمر، لكن هناك العديد من الأنواع الأخرى مثل الخرف الوعائي، الخرف المرتبط بأجسام ليوي أو الخرف الجبهي الصدغي.
كيف نتدخل لتقليل المشاكل المرتبطة بالخرف؟
يرتبط الجواب بالحصول على تشخيصات مبكرة ودقيقة تسمح بإجراء علاجات فعالة وموجهة خصيصًا لكل مرض. في عام 2017، أعلنت منظمة الصحة العالمية (OMS) بالفعل عن الحاجة إلى تحسين التشخيصات لمواجهة تزايد حالات الخرف على مستوى العالم. ومع ذلك، فإن الأنواع المختلفة من الخرف قد تكون أحيانًا صعبة التمييز في المراحل المبكرة لأن الأعراض المرتبطة بكل نوع معقدة. ويضاف إلى ذلك أنه في بعض الأحيان قد تتعايش أنواع مختلفة من الخرف معًا، ما يؤدي إلى عدد كبير من الأخطاء التشخيصية.
المعيار الذهبي
استندت هذه التشخيصات أساسًا إلى التقييمات العصبية النفسية. ومع ذلك، تم محاولة ربط هذه التشخيصات المعتمدة على الاختبارات المعرفية والسلوكية باختبارات تقيم عينات بيولوجية مثل صور الرنين، عينات الدم أو السائل الدماغي الشوكي، من بين أمور أخرى. بالرغم من الجهود الكبيرة المبذولة، لا يزال ينقصنا اختبار تشخيصي من نوع “المعيار الذهبي”. هذا هو الاسم الذي يُطلق على اختبار تشخيصي يتمتع بموثوقية عالية عند تشخيص مرض محدد. وقد سُعي إلى إيجاد هذا المعيار الذهبي أساسًا من خلال البيانات البيولوجية دون نجاح حتى الآن.
حل قائم على الذكاء الاصطناعي (IA)
لمعالجة هذا الوضع، اقترح فريق من الباحثين بجامعة بوسطن بالتعاون مع باحثين من مختلف أنحاء الولايات المتحدة حلًا قائمًا على الذكاء الاصطناعي يسمح بالعمل مع مجموعة كبيرة من البيانات ذات الطابع المتغاير. هذه البيانات متغايرة لأنها تعتمد على محاكاة العالم الواقعي; أي استخدام نفس الأدوات التي سيستخدمها أخصائي سريري لحل مشكلة التشخيص والوقاية المتعلقة بالخرف. تنوعت أنواع البيانات التي تناولها الباحثون لتشمل: بيانات سكانية وديموغرافية، بيانات عصبية، بيانات جسمية، التاريخ الطبي وصور الرنين المغناطيسي.
ما الذي تم القيام به؟
لتطبيق نموذج قائم على الذكاء الاصطناعي كانت هناك حاجة إلى كمية هائلة من البيانات، لذا لجأ الباحثون إلى تسعة مجموعات بيانات مستقلة تضم أكثر من 51.000 مريضًا يعانون أنواعًا مختلفة من الخرف.
مرضى يعانون أنواعًا مختلفة من الخرف
كان إدراج مجموعة واسعة من أنواع الخرف وذات أسباب متعددة خطوة أساسية للحصول على توصيف غني ومتنوِّع يمكن أن يكون ممثلًا للواقع. لذلك تم تضمين مرضى أصيبوا بالخرف بسبب أسباب مختلفة مثل مرض الزهايمر، السكتات الدماغية، الضمور الجبهي الصدغي، الضمور القشري القاعدي، الناتج عن التهابات، تعاطي المخدرات، إلخ.
مشكلة فقدان البيانات
ومع ذلك، قد تؤدي هذه المنهجية القائمة على كمية هائلة من البيانات أيضًا إلى وجود بيانات مفقودة. هذا عكس البيئات المحكمة جدًا وعدد المرضى الأقل، حيث يتم تقليل فقدان البيانات إلى حدٍ كبير. في هذه الحالة، يتطلب النهج مجموعات بيانات كبيرة جدًا ومتغايرة لتمكين النموذج من التعلم وأن يكون واقعيًا قدر الإمكان. ولحل المشكلة المتعلقة بفقدان البيانات، طبق الباحثون تقنيات توفر أقصى قدر من الصلابة خلال المراحل الأولى. إن تطبيق هذه الطرق والاستراتيجيات الصلبة يمنع انحياز تدريب الذكاء الاصطناعي وبالتالي يمنع أيضًا انحراف التنبؤات المستقبلية. بالإضافة إلى ذلك، اتُبعت إجراءات معيارية للإدراج والاستبعاد لضمان تناسق ومصداقية النتائج.
نموذج من نوع “ترانسفورمر”
في هذه المرحلة، يظهر تحدٍ مهم وهو إنشاء نموذج يسمح بتجميع أنواع متعددة من البيانات والمعايير ذات الطبيعة المختلفة، وهو ما يُسمى ببنية من نوع “ترانسفورمر”. في هذا النوع من النماذج تُؤخذ كل الخصائص المختلفة المدرجة وتُحوَّل إلى ما يُسمى “متجه بطول ثابت” باتباع استراتيجية محددة تسمح بإنشاء طبقة أولى للنموذج تُبنى عليها بقية الطبقات ليُفكَّك ذلك لاحقًا إلى سلسلة من التنبؤات.
لفهم ذلك بشكل أفضل، يمكننا التفكير في هذا النموذج كأنه وصفة طهي، فقط أنه بدلًا من الخطوات المختلفة التي لدينا في الوصفة، سيكون لدى النموذج طبقات متعددة. ولكن بنفس الطريقة التي نحتاجها للحصول على طبق جيد بعد الطهي، نحتاج إلى مكونات جيدة تتعاون بشكل مناسب. أراد الباحثون نظام تصنيف جيد للمرضى واحتاجوا أن تكون مكوناتهم؛ أي البيانات التي بدأوا بها جيدة ويمكن دمجها بشكل مناسب. في تمثيلنا لنموذج الذكاء الاصطناعي هذا سيكون الهدف تحويل البيانات المختلفة التي لدينا إلى تنسيق مشترك (متجه بطول ثابت). وبسبب ذلك سيكون النموذج الناتج قويًا جدًا أمام فقدان أو نقص البيانات وسيتمكن من إجراء تنبؤات موثوقة.
التعلّم الذاتي بالإشراف
تحديدًا يستخدمون نوعًا من النماذج يُسمى بالتعلّم الذاتي بالإشراف. في هذا النهج من التعلم الآلي يتعلم النموذج من البيانات دون الحاجة إلى تسميات صريحة. على عكس التعلم الموجه، الذي يتطلب مجموعة بيانات معنونة، يعتمد التعلم الذاتي بالإشراف على إيجاد هياكل وأنماط في البيانات دون التدخل البشري المباشر لوضع التسميات.
مرحلة التدريب، والتحقق، والمقارنة مع الخبراء
ما تلا ذلك في تطوير النموذج كان مرحلة التدريب والتحقق والمقارنة مع الخبراء. عمليات التدريب والتحقق شائعة في هذا النوع من الدراسات.
تضمن التدريب تغذية النموذج ببيانات من الفئات المختلفة، ودمج جميع النماذج لاستخلاص الأنماط المرتبطة بأنواع مختلفة من الخرف. وبعد تدريب النموذج جرت عملية التحقق باستخدام بيانات لم تُرَ من قبل، لضمان أن النموذج قادر على تعميم تنبؤاته على بيانات غير معروفة له.
وأخيرًا وبشكل مبتكر، اختبر الباحثون التشخيصات التي أجرها النموذج بمقارنة مع أطباء متخصصين في تشخيص الخرف. لدلك، دعوا مجموعة مكونة من 12 طبيبًا أعصاب و7 أطباء أشعة عصبية للمشاركة في مهام تشخيصية لمجموعة فرعية من 100 حالة بأنواع خرف مختلفة. أُعطوا البيانات المتاحة لكل حالة من هذه الحالات المئة وطلب منهم تقديم انطباعاتهم التشخيصية، بالإضافة إلى درجة ثقة تتراوح بين 0 و100 لتشخيص كل واحدة من التسميات الثلاثة عشر الممكنة. في هذه المرحلة كان المراد معرفة ما إذا كانت الأحكام السريرية يمكن تحسينها باستخدام النموذج المُطوَّر.
ما هي الاستنتاجات الرئيسية من هذه الدراسة حول الخرف والذكاء الاصطناعي (IA)؟
يمكن تقسيم النتائج الرئيسية إلى ثلاثة أجزاء: تصنيف الأصحاء مقابل المتدهورين، تصنيف الأمراض والتحسين في المعيار السريري باستخدام النموذج.
قيَّمَت الدراسة أداء نموذج ذكاء اصطناعي لتصنيف الأفراد إلى ثلاث فئات معرفية:
- الأصحاء أو الطبيعيون معرفيًا،
- ضعف إدراكي طفيف
- وخرف.
المقاييس المستخدمة لتقييم أداء النموذج كانت منحنيات ROC وPR. يمكن الاطلاع على النتائج في الجدول التالي (الجدول 1).
- تعكس المقاييس المحسوبة لـ نماذج ROC قدرة عالية للنموذج على التمييز بين الفئات الثلاث المذكورة، حيث تُقَيَّم هذه المقاييس من 0 إلى 1، ويُعتَبر القيمة القريبة من الواحد دلالة على تصنيف ممتاز.
- بالنسبة لمقاييس AUAP تشير القيم أيضًا إلى أداء جيد للنموذج، مع ضرورة مراعاة كل فئة بشكل مستقل.
| AUROC | AUAP | |
| Micro | 0.94 | 0.90 |
| Macro | 0.93 | 0.84 |
| Weight | 0.94 | 0.87 |
النتيجة الثانية للدراسة كانت تتعلق بقدرة النموذج على تشخيص عشرة أنواع مختلفة من الخرف، مظهرة نتائج دلالة عالية من حيث دقته التشخيصية.
- تُظهر نتائج مقاييس AUROC مرة أخرى فعالية كبيرة للنموذج، إذ كان قادرًا في معظم الحالات على التمييز بين أنواع الخرف.
- من جهة أخرى، تستمر نماذج AUPR في إظهار أن النموذج يملك أداءً جيدًا، وإن لم يكن ممتازًا (انظر الجدول 2)، مما يشير إلى أن النموذج أكثر دقة في بعض الأمراض مقارنة بأخرى.
| AUROC | AP | |
| Micro | 0.96 | 0.70 |
| Macro | 0.90 | 0.36 |
| Weight | 0.94 | 0.73 |
أخيرًا، فيما يتعلق بالتقييم السريري المدعوم بالذكاء الاصطناعي، تشير النتائج إلى أنه قد يزيد من الدقة التشخيصية مقارنة بما يقدمه الأخصائي السريري بمفرده. يتجلى ذلك في التحسن الملحوظ في تصنيف أنواع الخرف. على سبيل المثال:
حسَّن أطباء الأعصاب:
- بنسبة 12% في الكشف عن الضعف الإدراكي الطفيف،
- بنسبة 15% في التشخيص لمرض الزهايمر،
- بنسبة 26% للخرف الجبهي الصدغي حسب قيم AUROC.
- وكان التحسن ملحوظًا بشكل خاص في مرض البريون حيث تحسّن بنسبة 73%.
أطباء الأشعة:
- تحسّنوا في تشخيص الخرف من نوع الزهايمر بنسبة 9%
- بنسبة 6% للخرف الجبهي الصدغي،
- وكان التحسن ملحوظًا أيضًا لمرض البريون بنسبة 68%.
خلاصة القول، يمكننا استنتاج أن النماذج المستقبلية القائمة على الذكاء الاصطناعي قد تكون ذات فائدة كبيرة في التمييز التشخيصي عندما يعتمد هذا على الطابع متعدد العوامل لأنواع الخرف المختلفة. هذا قد لا يُحسّن التشخيص فحسب، بل يسهل أيضًا تخصيص العلاجات والتدخلات في المراحل المبكرة من المرض.
أين يمكن أن تُساهم NeuronUP في دراسة من هذا النوع؟
يمكن لـ NeuronUP أن تساهم بطرق متعددة في دراسة من هذا النوع.
- من خلال NeuronUP يمكن المساهمة في تنفيذ هياكل وتقنيات تسمح بتكرار أو إعادة إنتاج دراسة بهذه الخصائص نظرًا لأن مجموعات البيانات المستخدمة متاحة للاستخدام العام.
- يمكن تكرار الدراسة أو إعادة إنتاجها باستخدام إجراء مختلف قد يكون أكثر دقة أو أقل تكلفة.
- علاوة على ذلك، يمكن تطبيق تقنيات ونماذج تسمح بزيادة الدقة وتحديد أي أنواع البيانات تسهم أكثر في النموذج أو ما إذا كان من الممكن الحصول على مقاييس تصنيف جيدة باستخدام نوع واحد فقط من البيانات. مثال على ذلك هو استخدام البيانات العصبية النفسية والديموغرافية لمحاولة الحصول على نتائج مماثلة.
- من ناحية أخرى، لدى NeuronUP قاعدة بيانات كبيرة ذات طابع معرفي عصبي، لذا يمكن محاولة إجراء تصنيفات مماثلة تُـتوَجِّه بدقة الجوانب المعرفية العصبية التي قد تُسهل الكشف المبكر وتنبؤ التدهور. هذا ذو أهمية خاصة نظرًا لأن الخرف لا يزال ذا طابع عصبي نفسي وتأثير سلوكي كبير. في السنوات الأخيرة، أُحرزت تقدمات كبيرة في البحث عن العلامات الحيوية، لكن جودة حياة المريض تظل الأهمية القصوى والهم الأكبر بالنسبة له ولأحبائه. لذلك قد تكون زيادة الدقة في هذا الجانب أو إعداد ملف معرفي قائم على اختبارات معرفية ذات فائدة كبيرة.
- استمرارًا في الجانب المعرفي العصبي، وبما أن هذا الجانب لم يُتناول على نطاق واسع في المقال، يمكن الاستفادة من قواعد البيانات الكبيرة التي تملكها NeuronUP لـ إعادة إنتاج الدراسة مع مجموعة جديدة من المرضى. علاوة على ذلك، نوع البيانات العصبية النفسية المستخدمة في الدراسة غير موضح، وقد تكون هناك مجالات معرفية مختلفة أكثر أهمية.
الباحث الرئيسي: إن الدكتور Vijaya B. Kolachalama أستاذ مشارك في جامعة بوسطن والباحث الرئيسي لمختبر Kolachalama في نفس الجامعة. يوجه عمله أساسًا نحو تطبيق الذكاء الاصطناعي على المشاكل الطبية، وتتمثل مهمته في إنشاء أدوات تساعد أطباء الأعصاب في السيناريوهات الحقيقية، لا سيما في الأمراض التنكسية العصبية.
المراجع
- Xue, C., Kowshik, S.S., Lteif, D. et al. «التشخيص التفريقي لمسببات الخرف المعتمد على الذكاء الاصطناعي باستخدام بيانات متعددة النماذج». Nat Med (2024). https://doi.org/10.1038/s41591-024-03118-z
إذا أعجبتك هذه التدوينة على المدونة حول التشخيص التفريقي لمسببات الخرف المعتمد على الذكاء الاصطناعي باستخدام بيانات متعددة النماذج، فربما تهمك هذه المقالات من NeuronUP:
“تمت ترجمة هذا المقال. رابط المقال الأصلي باللغة الإسبانية:”
Diagnóstico diferencial de etiologías de demencia basado en IA sobre datos multimodales







علم النفس العصبي للكحول
اترك تعليقاً