في هذا المقال، تشرح طالبة الدكتوراه مارتا أربيزو غوميز الدراسة «نماذج اللغة الكبيرة تفكّك الحدس السريري في تشخيص التوحد»، التي تستكشف تأثير استخدام نماذج اللغة واسعة النطاق في تشخيص التوحد.
مقدمة
يعد تشخيص اضطراب طيف التوحّد (TEA) تقليديًا مهمة معقدة تعتمد بدرجة كبيرة على الخبرة السريرية والملاحظة التفصيلية وتفسير سلوكيات متنوّعة. على الرغم من وجود دلائل تشخيصية محددة جيدًا مثل DSM-5، إلا أن الممارسة السريرية غالبًا ما تُسترشد بـ «الحدس» الذي يطوّره المهنيون على مدار سنوات من الخبرة. لكن ماذا لو أمكننا “قراءة” هذا الحدس وفهمه من منظور أكثر موضوعية؟
نشرت مؤخرًا دراسة في مجلة Cell، بعنوان «نماذج اللغة الكبيرة تفكّك الحدس السريري وراء تشخيص التوحد»، تستكشف بالضبط هذه الإمكانية: استخدام نماذج لغوية واسعة النطاق (LLMs، بالاختصار الإنجليزي) لاكتشاف الأنماط التي يتبعها الأطباء عند تشخيص التوحد. النتائج لم تكن مفاجئة فحسب، بل قد تحمل تداعيات عميقة على كيفية فهمنا وإجرائنا لتشخيصات TEA حاليًا.
السياق: لماذا من الضروري مراجعة طريقة تشخيص التوحد؟
يُعد اضطراب طيف التوحّد اضطرابًا في تطور الأعصاب يتميز بـ صعوبات في التواصل الاجتماعي وأنماط سلوكية واهتمامات مقيدة ومتكررة. ومع ذلك، قد تظهر هذه السمات بتفاوت كبير بين الأفراد، مما يجعل التشخيص عملية دقيقة وأحيانًا ذاتية.
بالإضافة إلى ذلك، على الرغم من أن أدوات التشخيص المعيارية مثل ADOS أو ADI-R تضفي هيكلًا على العملية، فإن العديد من التشخيصات تعتمد على تقارير سردية يكتبها الأطباء الذين راقبوا المريض. أي أن الطريقة التي يصف بها الطبيب المريض يمكن أن يكون لها تأثير كبير على التشخيص النهائي.
أمام هذا الواقع، طرح الباحثون سؤالًا محوريًا: ما العناصر داخل هذه التقارير المكتوبة التي تقود بالفعل قرارات التشخيص؟
ماذا فعل الباحثون؟
جمع مؤلفو الدراسة أكثر من 40.000 تقريرٍ سريري للأطفال من نظام الرعاية الصحية العامة في ماساتشوستس. تضمنت هذه التقارير، التي كتبها مختصّو الصحة العقلية، أوصافًا مفصّلةً لسلوكيات المرضى ومستوى أدائهم.
باستخدام هذه القاعدة البيانية، قام الباحثون بتدريب عدة نماذج لغوية، بما في ذلك GPT-4 (طورته OpenAI) ونموذج سريري مفتوح المصدر يدعى Clinician-LLaMA. كانت الفكرة أن تتعلم النماذج توقّع ما إذا كان التقرير السريري يتوافق مع مريض مُشخّص بالتوحد أم لا، اعتمادًا فقط على النص.
وكانت النتائج مذهلة: فقد حققت النماذج دقة ملحوظة في التصنيف، حتى عندما فُقدت معلومات أساسية مثل جنس المريض أو عمره. وقد دلّ ذلك على أن التقارير تحتوي على أنماط لغوية ضمنية يمكن للنماذج اكتشافها والتي تعكس كيفية اتخاذ الأطباء لقراراتهم.
ماذا وجدوا؟
بعيدًا عن الدقة في التنبؤ، كان الأكثر إثارةً ما كشفته النماذج بشأن عملية التشخيص نفسها. عند تحليل الأجزاء النصية التي كان لها وزن أكبر في قرارات النموذج، تبيّن أن أنواعًا معيّنة من السلوكيات والأوصاف كانت أكثر حسمًا من غيرها.
كما نرى في المخطط، كانت السلوكيات المتكررة، النمطية، الاهتمامات المقيدة والجوانب المتعلقة بالإحساس الحسي هي العوامل الأكثر ارتباطًا بالتشخيص الإيجابي للتوحد. على النقيض من ذلك، تبين أن الصعوبات في التفاعل الاجتماعي، التي تُعد أحد أركان التشخيص التقليدية وفقًا لـ DSM-5، كان لها وزن أقل في النماذج.
هذا لا يعني أن الصعوبات الاجتماعية غير مهمة، بل إن الأطباء عمليًا يبدون وكأنهم يولون اهتمامًا أكبر —ربما بشكل غير واعٍ— لأنماط سلوكية أخرى عند اتخاذ قرار ما إذا كان المريض يستوفي معايير التشخيص أم لا.
فيما يلي، نلخّص النتائج الرئيسية للدراسة في جدول لتسهيل الفهم:
البُعد المحلّل | النتيجة / الملاحظة |
---|---|
النموذج المستخدم | GPT-4 و Clinician-LLaMA (نماذج لغوية مُدربة على تقارير سريرية). |
مصدر البيانات | أكثر من 40.000 تقرير سريري للأطفال من نظام الرعاية الصحية العامة في ماساتشوستس. |
مهمة النموذج | توقّع ما إذا كان المريض مُشخّصًا بالتوحد بالاعتماد فقط على نص التقرير. |
دقة النموذج | عالية، حتى عند إخفاء متغيرات مثل الجنس أو العمر. |
العوامل الأكثر حسمًا في التشخيص | السلوكيات التكرارية، الاهتمامات المقيدة والسمات الحسية/الإدراكية. |
العوامل الأقل تأثيرًا | صعوبات التفاعل الاجتماعي. |
النتيجة الأساسية | في الممارسة السريرية، تؤثر السلوكيات القابلة للملاحظة أكثر مما كان متوقعًا. |
التأثير المحتمل على معايير التشخيص | يشير إلى الحاجة لإعادة تقييم وزن بعض المعايير في DSM-5. |
تطبيق الذكاء الاصطناعي في الصحة النفسية | كأداة لدعم التشخيص وتحليل التفكير السريري. |
كما هو واضح، لم تكتفِ نماذج اللغة بتوقّع تشخيص TEA بدقة عالية فحسب، بل كشفت أيضًا أن أنماطًا سلوكية معيّنة —وخاصة السلوكيات المتكررة والاهتمامات المقيدة— لها تأثير أكبر في الممارسة السريرية مما تشير إليه المعايير التقليدية. هذا يفتح الباب للتفكير في كيفية تطبيق هذه المعايير في السياق العملي.
التداعيات: هل يجب إعادة التفكير في معايير تشخيص التوحد؟
تفتح هذه النتائج نقاشًا مهمًا: هل تعكس المعايير التشخيصية الحالية فعلاً الطريقة التي يقيم بها المهنيون المرضى؟
إذا كان الأطباء، بشكل منهجي، يولون أهمية أكبر للسلوكيات القابلة للملاحظة مثل الحركات النمطية أو الاهتمامات المقيدة، فقد يكون من الضروري إعادة تقييم الوزن المعطى لكل فئة تشخيصية في الدلائل الرسمية.
علاوة على ذلك، قد يكون لهذا النهج تداعيات على تدريب المهنيين الجدد، الذين قد يستفيدون من فهم كيفية تطبيق المعايير في الممارسة العملية، بعيدًا عن الجانب النظري.
هل يمكن للذكاء الاصطناعي المساعدة في التشخيص السريري للتوحد؟
واحدة من الوعود الكبيرة للذكاء الاصطناعي في مجال الصحة هي قدرته على كشف أنماط معقّدة في أحجام كبيرة من البيانات. في هذه الحالة، لا تعمل نماذج اللغة كأدوات تصنيف فحسب، بل أيضًا كـ أدوات تسمح لنا بجعل ما هو خفي مرئيًا: المنطق الكامن وراء القرارات السريرية.
بعيدًا عن استبدال المهنيين، يمكن لهذه النماذج أن تعمل كحلفاء، مقدّمة رأيًا ثانياً مستندًا إلى آلاف الحالات السابقة، ومساعدة في اكتشاف الانحيازات أو التناقضات في عمليات التشخيص.
أين يمكن أن تسهم NeuronUP في دراسات مثل هذه؟
يمكن لـ NeuronUP أن تسهم بشكل كبير في دراسات من هذا النوع من خلال تسهيل التكرار في مجموعات سكانية أكثر تنوعًا وغير ناطقة بالإنجليزية، بفضل تواجدها الدولي. تتيح منصتها، التي تضم أكثر من مئات الأنشطة المعرفية، إمكانية تكملة تحليل التقارير السريرية ببيانات منظمة عن الأداء المعرفي. بالإضافة إلى ذلك، يمكن تطبيق هذا النهج على حالات سريرية أخرى مثل ADHD أو تراجع الإدراك الطفيف، مما يحسّن الاكتشاف المبكر ودقة التشخيص.
خلاصة الدراسة
تمثّل هذه الدراسة علامة فارقة في تقاطع الذكاء الاصطناعي والصحة النفسية. من خلال استخدام نماذج اللغة لتحليل التقارير السريرية، لم يثبت الباحثون فقط أن تشخيص التوحد يمكن التنبؤ به بدقة ملحوظة، بل كشفوا أيضًا كيف يُبنى “الحدس السريري” الذي يوجّه هذه القرارات.
في المستقبل القريب، قد تُدمج أدوات مثل هذه في أنظمة الرعاية الصحية لتقديم دعم تشخيصي، وتحسين تدريب المهنيين، وربما حتى إعادة تعريف المعايير التي نفهم بها التوحد. والواضح أن الذكاء الاصطناعي لا يغيّر التكنولوجيا فحسب، بل أيضًا طريقتنا في فهم العقل البشري.
المراجع
- Feng S, Sondhi R, Tu X, Buckley J, Sands A, Comiter A, Zhang H, Gao R, Sragovich S, Mello JD, Fedorenko E, Saxe R, Sontheimer EJ, Sapiro G, O’Reilly UM, McCoy TH, Beam AL. نماذج اللغة الكبيرة تفكّك الحدس السريري وراء تشخيص التوحد. Cell. 2024 Mar 21. doi: 10.1016/j.cell.2024.03.004.
إذا أعجبك هذا الموضوع في المدونة حول كيف يمكن أن تساعد نماذج اللغة المشابهة لـ ChatGPT في تشخيص التوحد، فربما تهمك هذه المقالات من NeuronUP:
“تمت ترجمة هذا المقال. رابط المقال الأصلي باللغة الإسبانية:”
¿Pueden los modelos de lenguaje tipo ChatGPT ayudar a diagnosticar el autismo?
اترك تعليقاً