En este artículo, la doctoranda Marta Arbizu Gómez expone el estudio «Los grandes modelos lingüísticos deconstruyen la intuición clínica para diagnosticar el autismo», en el que se explora el impacto de la utilización de modelos de lenguaje a gran escala para el diagnóstico del autismo.
Introducción
El diagnóstico del trastorno del espectro autista (TEA) ha sido tradicionalmente una tarea compleja, que depende en gran medida de la experiencia clínica, la observación detallada y la interpretación de comportamientos diversos. Aunque existen guías diagnósticas bien definidas como el DSM-5, la práctica clínica muchas veces se guía por una “intuición” que los profesionales desarrollan tras años de experiencia. Pero ¿qué pasaría si pudiéramos “leer” esa intuición y entenderla desde un enfoque más objetivo?
Un reciente estudio publicado en la revista Cell, titulado «Large language models deconstruct the clinical intuition behind diagnosing autism», explora precisamente esta posibilidad: utilizar modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) para desentrañar los patrones que los clínicos siguen al diagnosticar el autismo. Los hallazgos no solo son sorprendentes, sino que también podrían tener implicaciones profundas sobre cómo entendemos y realizamos los diagnósticos de TEA en la actualidad.
El contexto: ¿por qué es necesario revisar la forma en que diagnosticamos el autismo?
El TEA es un trastorno del neurodesarrollo caracterizado por desafíos en la comunicación social y patrones de comportamiento e intereses restringidos y repetitivos. Sin embargo, estas características pueden presentarse con gran variabilidad entre individuos, lo que hace que el diagnóstico sea un proceso matizado y, a veces, subjetivo.
Además, aunque las herramientas diagnósticas estandarizadas como ADOS o ADI-R aportan estructura al proceso, muchos diagnósticos se basan en informes narrativos escritos por clínicos que han observado al paciente. Es decir, la forma en que el clínico describe al paciente puede tener un gran peso en el diagnóstico final.
Frente a esta realidad, los investigadores se plantearon una pregunta clave: ¿qué elementos dentro de estos informes escritos están realmente guiando las decisiones de diagnóstico?
Suscríbete
a nuestra
Newsletter
¿Qué hicieron los investigadores?
Los autores del estudio recopilaron más de 40.000 informes clínicos de pacientes infantiles del sistema de salud pública de Massachusetts. Estos informes, escritos por profesionales de la salud mental, contenían descripciones detalladas del comportamiento y funcionamiento de los pacientes.
Con esta base de datos, los investigadores entrenaron varios modelos de lenguaje, incluyendo GPT-4 (desarrollado por OpenAI) y un modelo clínico de código abierto llamado Clinician-LLaMA. La idea era que los modelos aprendieran a predecir si un informe clínico correspondía a un paciente con diagnóstico de TEA o no, solo basándose en el texto.
Los resultados fueron sorprendentes: los modelos lograron una precisión notable en la clasificación, incluso cuando se les ocultaba información clave como el sexo o la edad del paciente. Esto sugería que los informes contenían patrones de lenguaje implícitos que los modelos podían detectar y que reflejaban cómo los clínicos toman decisiones.
¿Qué encontraron?
Más allá de la precisión en la predicción, lo más interesante fue lo que los modelos revelaron sobre el proceso diagnóstico en sí. Al analizar qué fragmentos del texto tenían mayor peso en las decisiones del modelo, los investigadores identificaron que ciertos tipos de conductas y descripciones eran más determinantes que otros.
Como podemos apreciar en el gráfico, los comportamientos repetitivos, estereotipados, los intereses restringidos y los aspectos relacionados con la percepción sensorial fueron los factores más asociados con un diagnóstico positivo de TEA. Por el contrario, las dificultades en la interacción social, que son uno de los pilares tradicionales del diagnóstico según el DSM-5, resultaron tener menos peso en los modelos.
Esto no significa que las dificultades sociales no sean relevantes, sino que, en la práctica, los clínicos parecen prestar más atención —quizás de forma inconsciente— a otros patrones conductuales al momento de decidir si un paciente cumple con los criterios diagnósticos.
A continuación, se resumen los principales resultados del estudio en una tabla para facilitar su comprensión:
Aspecto analizado | Resultado / Observación |
Modelo utilizado | GPT-4 y Clinician-LLaMA (modelos de lenguaje entrenados con informes clínicos). |
Fuente de datos | Más de 40.000 informes clínicos pediátricos del sistema de salud pública de Massachusetts. |
Tarea del modelo | Predecir si el paciente tenía diagnóstico de autismo basándose solo en el texto del informe. |
Precisión del modelo | Alta, incluso cuando se ocultaban variables como sexo o edad. |
Factores más determinantes en el diagnóstico | Comportamientos repetitivos, intereses restringidos y rasgos sensoriales/perceptivos. |
Factores menos determinantes | Dificultades en la interacción social. |
Implicación clave | En la práctica clínica, los comportamientos observables influyen más de lo esperado. |
Posible impacto en criterios diagnósticos | Sugiere necesidad de reevaluar el peso de ciertos criterios en el DSM-5. |
Aplicación de IA en salud mental | Como herramienta de apoyo diagnóstico y análisis del razonamiento clínico. |
Como puede observarse, los modelos de lenguaje no solo lograron predecir el diagnóstico de TEA con alta precisión, sino que también revelaron que ciertos patrones conductuales —particularmente los comportamientos repetitivos y los intereses restringidos— son más influyentes en la práctica clínica de lo que sugieren los criterios diagnósticos tradicionales. Esto abre la puerta a una reflexión sobre cómo se aplican estos criterios en el contexto real.
Implicaciones: ¿debemos repensar los criterios diagnósticos del autismo?
Estos hallazgos abren una discusión importante: ¿los criterios diagnósticos actuales reflejan realmente la forma en que los profesionales evalúan a los pacientes?
Si los clínicos, de forma sistemática, dan más importancia a los comportamientos observables como las estereotipias o los intereses restringidos, podría ser necesario reevaluar el peso que se da a cada categoría diagnóstica en las guías oficiales.
Además, este enfoque podría tener implicaciones para la formación de nuevos profesionales, quienes podrían beneficiarse de entender cómo se aplican los criterios en la práctica real, más allá de la teoría.
¿Puede la inteligencia artificial ayudar en el diagnóstico clínico de TEA?
Una de las grandes promesas de la inteligencia artificial en el ámbito de la salud es su capacidad para detectar patrones complejos en grandes volúmenes de datos. En este caso, los modelos de lenguaje no sólo actúan como herramientas de clasificación, sino también como instrumentos que nos permiten hacer visible lo invisible: la lógica implícita detrás de las decisiones clínicas.
Lejos de reemplazar a los profesionales, estos modelos pueden funcionar como aliados, ofreciendo una segunda opinión basada en miles de casos previos, y ayudando a detectar sesgos o inconsistencias en los procesos diagnósticos.
¿Dónde podría aportar NeuronUP en estudios como este?
NeuronUP podría aportar significativamente a estudios como este al facilitar la replicación en poblaciones más diversas y no angloparlantes, gracias a su presencia internacional. Su plataforma, con más de cientos de actividades cognitivas, permitiría complementar el análisis de informes clínicos con datos estructurados sobre desempeño cognitivo. Además, este enfoque podría aplicarse a otras condiciones clínicas como el TDAH o el deterioro cognitivo leve, mejorando la detección temprana y la precisión diagnóstica.
Prueba NeuronUP 7 días gratis
Podrás trabajar con nuestras actividades, diseñar sesiones o rehabilitar a distancia
Conclusión del estudio
Este estudio marca un hito en la intersección entre inteligencia artificial y salud mental. Al utilizar modelos de lenguaje para analizar informes clínicos, los investigadores no solo han demostrado que el diagnóstico del autismo puede predecirse con notable precisión, sino que también han revelado cómo se construye la “intuición clínica” que guía estas decisiones.
En un futuro cercano, herramientas como estas podrían integrarse en los sistemas de salud para ofrecer soporte diagnóstico, mejorar la formación de profesionales, y quizás incluso redefinir los criterios con los que entendemos el autismo. Lo que está claro es que la inteligencia artificial no solo está transformando la tecnología, sino también nuestra forma de entender la mente humana.
Bibliografía
- Feng S, Sondhi R, Tu X, Buckley J, Sands A, Comiter A, Zhang H, Gao R, Sragovich S, Mello JD, Fedorenko E, Saxe R, Sontheimer EJ, Sapiro G, O’Reilly UM, McCoy TH, Beam AL. Large language models deconstruct the clinical intuition behind diagnosing autism. Cell. 2024 Mar 21. doi: 10.1016/j.cell.2024.03.004.
Deja una respuesta