Antonio Javier Sutil Jiménez يتحدث في هذا المقال عن البيانات المقدمة في الدراسة «نموذج تعلم عميق للكشف المبكر عن التدهور المعرفي من ملاحظات سريرية في السجلات الصحية الإلكترونية».
لماذا تعتبر هذه الدراسة حول نموذج تعلّم مستند إلى الملاحظات السريرية مهمة؟
تتناول هذه الدراسة الكشف المبكر للتدهور المعرفي لدى البالغين، وهو أمر أساسي لإمكانية تنفيذ تدخلات علاجية ناجحة، وإبطاء التدهور، ومنع تطور الأمراض أو تسهيل تسجيل المشاركين في التجارب السريرية.
مرض الزهايمر
مرض الزهايمر هو نوع من الخرف يمثل مشكلة كبيرة على مستوى العالم. تم تشخيص هذا المرض لدى ما يقارب 6 ملايين شخص في الولايات المتحدة، وتزداد انتشاره مع التقدم في العمر، لذلك من المتوقع أن يؤدي شيخوخة السكان إلى زيادة حدوثه على مدى السنوات القادمة.
ومع ذلك، بعيدًا عن مرض الزهايمر، يُعدّ الضعف الإدراكي الطفيف مشكلة ذات أهمية كبيرة، حيث يرتبط في كثير من الحالات بتطور لاحق للخرف.
الضعف الإدراكي الذاتي
بنفس المنوال، تم مؤخرًا إنشاء فئة الضعف الإدراكي الذاتي. يشير هذا المصطلح إلى إحساس الفرد بأنه يمر بتدهور في قدراته المعرفية مقارنةً بحالته السابقة.
على الرغم من أن هذا التصنيف ليس مرضًا بحد ذاته، فقد تبين أن الأشخاص الذين يعانون من هذه الحالة قد يكونون في مرحلة مبكرة من التدهور المعرفي.
كشف التدهور المعرفي
رغم الجهود الكبيرة المبذولة لتحسين علاجات هؤلاء المرضى، يظل كشف التدهور المعرفي بمثابة تحدٍ، ومن الضروري تحسين أدوات الكشف لكي تكون العلاجات اللاحقة فعّالة.
أدوات في الرعاية الأولية
نظرًا لأن عدد المتخصصين القادرين على رعاية الفئات المعرضة للخطر محدود، قد تكون إحدى الحلول هي تزويد أطباء الرعاية الأولية بالأدوات. فهؤلاء الأطباء ليسوا متخصصين في الخرف، لكنهم يتواصلون مباشرة مع هذه الفئة من السكان، لذا فإن تزويدهم بأدوات للتشخيص يعد حلًا قابلًا للتطبيق.
السجلات الطبية الإلكترونية
يقترح استخدام السجلات الطبية الإلكترونية كبديل مناسب لتطوير مثل هذه الأدوات، إذ تجمع هذه السجلات تاريخ زيارات المرضى داخل نظام الرعاية الصحية.
مع ذلك، من المهم إبراز صعوبة التعرف على علامات التدهور المعرفي غير المرتبطة بالعمر، والتي غالبًا ما تُسجل في التقييمات المعرفية وفي قلق المرضى المسجل من قبل المختصين الصحيين. وعلى الرغم من إجراء دراسات باستخدام المعلومات السريرية للمرضى، نادرًا ما تم التعمق في استخدام الملاحظات السريرية داخل السجلات الطبية لهذا الغرض.
الملاحظات السريرية كمورد معلوماتي
تقترح هذه الدراسة استخدام الملاحظات السريرية كمورد معلوماتي قد يلتقط معلومات لا تُؤخذ بعين الاعتبار في معظم الدراسات. وإن تحليل الملاحظات السريرية يدويًا سيكون مكلفًا جدًا، لذلك كان الهدف من الدراسة تطوير نموذج كشف تلقائي قائم على التعلم العميق.
لذلك، فإن نهج هذه الدراسة أصلي ومبتكر باستخدام الملاحظات السريرية.
تعد الملاحظات السريرية مهمة جدًا لسجلات الصحة في المجال السريري. ومع ذلك، كان استخدامها في المجال العلمي محدودًا مما يجعل تطبيقها للكشف المبكر عن التدهور المعرفي ذا اهتمام كبير.
ما الذي تمّ عمله؟
قاعدة بيانات
لإجراء هذه الدراسة، أُخذت البيانات من شركة صحة خاصة، وتمت تصفية المرضى حسب العمر (يجب أن يكونوا فوق 50 عامًا) وحسب تشخيص الضعف الإدراكي الطفيف. على وجه التحديد، تم تحليل الملاحظات السريرية للسنوات الأربع التي سبقت التشخيص.
استُند تعريف الضعف الإدراكي إلى ذكر الأعراض، والتشخيص، والتقييمات المعرفية، والعلاجات. عندما أشارت الملاحظات إلى تحسن أو نوبات عابرة أو قابلة للانعكاس، اعتُبرت سلبية بالنسبة للضعف المعرفي.
معالجة الملاحظات السريرية وتطوير قاعدة البيانات
في البداية، ونظرًا لطول الملاحظات السريرية، استُخدم معالج للغة الطبيعية لتقسيمها إلى مقاطع. سمح هذا التقسيم بتحديد ما إذا كانت كل مقطع تشير إلى وجود تدهور معرفي أم لا.
بعد ذلك، تم تحديد كلمات مفتاحية اختارها خبراء، مدرّبون لتحديد المقاطع التي تحتوي على دلائل على التدهور المعرفي. قام ثلاثة مُعلِّقين بوضع علامات على المقاطع، وتم حل النزاعات من خلال مناقشات مع خبراء في المجال، محققين مستوى اتفاق جيد بين المعلّقين.
بالإضافة إلى ذلك، تم إنشاء مجموعة بيانات معنونة تضم 4,950 مقطعًا لتدريب واختبار عدة خوارزميات تعلم آلي. وأخيرًا، تم إنشاء قاعدتي بيانات سيتم استخدامهما لتطوير والتحقق من صحة النموذج.
مجموعات البيانات
كانت مجموعة البيانات الأولى، المستخدمة لتطوير النموذج، تتضمن فقط المقاطع التي تحتوي على كلمات مفتاحية مختارة. احتوت هذه المجموعة على 4,950 مقطعًا معنونا جاهزة لتطوير نماذج التعلم الآلي.
تكوّنت مجموعة البيانات الثانية من 2,000 مقطع تم اختيارها عشوائيًا من جميع الملاحظات، باستثناء تلك المستخدمة في المجموعة الأولى. استُخدمت هذه المجموعة الثانية لاختبار قدرة تعميم النموذج على مقاطع الملاحظات دون تطبيق فلتر قائم على الكلمات المفتاحية.
تطوير النموذج والتحقق من صحته
لتطوير النموذج، استخدموا بنية هرarchica للانتباه قائمة على التعلم العميق تم تطويرها في عمل سابق، بالإضافة إلى أربع خوارزميات أساسية للتعلم الآلي: الانحدار اللوجستي، الغابة العشوائية، آلة المتجهات الداعمة وXGBoost.
كان النموذج المطور سابقًا يضم شبكة عصبية تلافيفية مكيّفة للسياق، مما سمح بالتعامل مع تباينات الكلمات وتفسير التنبؤ عبر طبقات الانتباه. للحصول على مزيد من المعلومات عن النموذج، يُنصح بالاطلاع على المقال المعني وجداوله التكاملية.
تفسير تنبؤ النموذج
لتفسير تنبؤ النموذج، تم تحديد الكلمات ذات الوزن الأكبر في طبقات الانتباه المستخدمة في التنبؤ. اعتُبرت الكلمات ذات وزن ذي دلالة، أي التي تفوق المتوسط بمقدار لا يقل عن انحرافين معياريين، ذات انتباه عالٍ وقورنت مع الكلمات المفتاحية الأصلية المختارة.
من ناحية أخرى، بالنسبة للنماذج الأساسية، مثلّمت المقاطع بواسطة تكرار ظهور المصطلحات، وتم تدريب الخوارزميات واختبارها عن طريق التحقق المتقاطع. بعد ذلك، قُورنت نتائج النموذج المطوَّر من قِبل فريق البحث مع النماذج الأساسية الأربعة المذكورة.
مقارنة المقاييس
كانت مقياسان مستخدمان لمقارنة الأداء هما AUROC (المساحة تحت منحنى ROC) وAUPRC (المساحة تحت منحنى الدقة والاستدعاء).
يُعد AUROC أسلوب تحليل شائعًا في هذه النماذج، لأنه يسمح بتقييم العتبات المختلفة بين الحساسية والنوعية. أما AUPRC فهي مقياس مهم آخر يقدم معلومات تكميلية للبيانات غير المتوازنة، عندما تكون نسبة الحالات الإيجابية منخفضة.
ما هي الاستنتاجات الرئيسية لهذه الدراسة حول نموذج التعلّم من الملاحظات السريرية؟
الخلاصة الرئيسية لهذه الدراسة هي أنه من الممكن إجراء توقعات تشخيصية للتدهور المعرفي باستخدام نموذج قائم على الملاحظات السريرية. قد يكون هؤلاء المرضى في المراحل الأولى من التدهور المعرفي، مما يتيح التعرف على إشارات مبكرة في السجلات الصحية الإلكترونية.
كان النموذج المطوَّر لهذا الغرض الأفضل في التنبؤ لاكتشاف المرضى الذين سيطورون تدهورًا معرفيًا، دون الاعتماد على البيانات المهيكلة. وعلى الرغم من أن نموذج التعلم العميق كان الأفضل، فإن نموذج XGBoost أظهر أيضًا تنبؤات جيدة، ويُطرح كبديل أبسط في حال عدم توفر التكنولوجيا اللازمة.
مقاييس AUROC وAUPRC
لمعالجة هذه النتائج، يمكن الاطلاع على الدرجات المحققة في مقاييس AUROC وAUPRC في مجموعتي البيانات 1 و2 (انظر الجدولين 1 و2 على التوالي). ومن الجدير بالملاحظة أن النموذج القائم على التعلم العميق هو الأفضل في التنبؤ في كلا المقياسين.
في حالة AUROC، جميع القيم أعلى من 0.9، وكان نموذج التعلم العميق دائمًا الأفضل في التنبؤ. أما بالنسبة إلى AUPRC، فالأمر أكثر وضوحًا، إذ إن هذا النموذج هو الوحيد الذي يبقى فوق القيمة 0.9.
الفروق بين هذه المقاييس تعزز اتساق النتائج، إذ بينما يُظهر AUROC العلاقة بين معدل الإيجابيات الحقيقية والإيجابيات الكاذبة، يعكس AUPRC العلاقة بين الدقة والحساسية.
في عينات غير متوازنة، قد يكون مقياس AUROC أقل تحفظًا تجاه الإيجابيات الكاذبة، لذا فإن المعلومات التكميلية من AUPRC تسمح بتأكيد الأداء الجيد لهذا النموذج.
| النموذج | AUROC | AUPRC |
| الانحدار اللوجستي | 0.936 | 0.880 |
| الغابة العشوائية | 0.950 | 0.889 |
| آلة المتجهات الداعمة | 0.939 | 0.883 |
| XGBoost | 0.953 | 0.882 |
| التعلم العميق | 0.971 | 0.933 |
| النموذج | AUROC | AUPRC |
| الانحدار اللوجستي | 0.969 | 0.762 |
| الغابة العشوائية | 0.985 | 0.830 |
| آلة المتجهات الداعمة | 0.954 | 0.723 |
| XGBoost | 0.988 | 0.898 |
| التعلم العميق | 0.997 | 0.929 |
أداء النموذج
نقطة أخرى يبرزها هذا البحث هي أن طول الملاحظات قد يؤثر على أداء النموذج؛ ومع ذلك، يُظهر الحفاظ على محتوى كافٍ أن التصنيف بحسب المقاطع قد يكون قابلًا للتطبيق.
علاوة على ذلك، قد يُطبَّق هذا النوع من النماذج على أمراض أخرى، مع ضرورة مراعاة أن تحديد المعلومات الغامضة أو المعقدة قد يكون صعبًا.
أين يمكن أن تسهم NeuronUP في دراسة مثل هذه؟
NeuronUP يمكن أن تسهم بطرق متعددة في دراسة من هذا النوع، إذ لديها خبرة واسعة في التعامل مع كميات كبيرة من البيانات.
كما يظهر في هذه الدراسة، يعدّ التعامل مع أحجام كبيرة من البيانات أحد التحديات الرئيسية عند العمل مع الملاحظات السريرية. وبالتالي، يمكن لفريق NeuronUP، الذي يضم مختصين في المجالين الإكلينيكي وتحليل البيانات، أن يقدّم مساهمات قيمة في معالجة المعلومات، سواء عن طريق استخدام الكلمات المفتاحية أو دونها.
من ناحية أخرى، تبرز هذه الدراسة بمقارنة خمسة نماذج مختلفة، مما يمنح متانة للنتائج المحققة لنموذجهم. كما يمكن أن تكون خبرة فريق NeuronUP مفيدة في تصميم نموذج مخصّص لهذا الغرض، أو في إنشاء نماذج متينة لمقارنتها مع النموذج المطوّر.
Li Zhou. أستاذة في كلية الطب بجامعة هارفارد لأكثر من عشر سنوات، وهي الباحثة الرئيسية في Brigham and Women’s Hospital. تحمل دكتوراه في المعلوماتية الطبية الحيوية من جامعة كولومبيا، وتركز أبحاثها على معالجة اللغة الطبيعية، وإدارة المعرفة، ودعم اتخاذ القرار السريري. كما كانت الباحثة الرئيسية في العديد من مشاريع البحث الممولة من قبل AHRQ وNIH وCRICO/RMF.
المراجع
- Wang L, Laurentiev J, Yang J, et al. Development and Validation of a Deep Learning Model for Earlier Detection of Cognitive Decline From Clinical Notes in Electronic Health Records. JAMA Netw Open. 2021;4(11):e2135174. doi:10.1001/jamanetworkopen.2021.35174
إذا أعجبتك هذه التدوينة حول الـ نموذج التعلم العميق للكشف المبكر عن التدهور المعرفي من ملاحظات السجلات الطبية الإلكترونية، فربما تهمك هذه المقالات من NeuronUP:
“تمت ترجمة هذا المقال. رابط المقال الأصلي باللغة الإسبانية:”
Modelo de aprendizaje profundo para la detección temprana del deterioro cognitivo a partir de notas clínicas en historias clínicas electrónicas







FOMO: الخوف من أن تفوّتك الفرصة في عصر الرقمنة
اترك تعليقاً