En este artículo, la doctoranda Marta Arbizu Gómez expone el estudio «Los grandes modelos lingüísticos deconstruyen la intuición clínica para diagnosticar el autismo», en el que se explora el impacto de la utilización de modelos de lenguaje em grande escala para o diagnóstico do autismo.
Introducción
O diagnóstico do transtorno do espectro autista (TEA) tem sido tradicionalmente uma tarefa complexa, que depende em grande medida da experiência clínica, da observação detalhada e da interpretação de comportamentos diversos. Ainda que existam diretrizes diagnósticas bem definidas como o DSM-5, a prática clínica muitas vezes se guia por uma “intuición” que os profissionais desenvolvem após anos de experiência. Mas o que aconteceria se pudéssemos “ler” essa intuição e entendê-la a partir de uma abordagem mais objetiva?
Um estudo recente publicado na revista Cell, intitulado “Large language models deconstruct the clinical intuition behind diagnosing autism”, explora precisamente essa possibilidade: utilizar modelos de linguagem em grande escala (LLMs, pelas suas siglas em inglês) para desvendar os padrões que os clínicos seguem ao diagnosticar o autismo. Os achados não só são surpreendentes, como também podem ter implicações profundas sobre como entendemos e realizamos os diagnósticos de TEA atualmente.
O contexto: ¿por qué es necesario revisar la forma en que diagnosticamos el autismo?
O TEA é um transtorno do neurodesenvolvimento caracterizado por desafios na comunicação social e padrões de comportamento e interesses restritos e repetitivos. No entanto, essas características podem se apresentar com grande variabilidade entre os indivíduos, o que torna o diagnóstico um processo matizado e, às vezes, subjetivo.
Além disso, embora as ferramentas diagnósticas padronizadas como ADOS ou ADI-R aportem estrutura ao processo, muitos diagnósticos se baseiam em relatórios narrativos escritos por clínicos que observaram o paciente. Ou seja, a forma como o clínico descreve o paciente pode ter um grande peso no diagnóstico final.
Diante dessa realidade, os pesquisadores colocaram uma pergunta chave: quais elementos dentro desses relatórios escritos estão realmente guiando as decisões de diagnóstico?

Inscreva-se
na nossa
Newsletter
O que fizeram os investigadores?
Os autores do estudo reuniram mais de 40.000 relatórios clínicos de pacientes pediátricos do sistema de saúde pública de Massachusetts. Esses relatórios, escritos por profissionais de saúde mental, continham descrições detalhadas do comportamento e funcionamento dos pacientes.
Com essa base de dados, os pesquisadores treinaram vários modelos de linguagem, incluindo GPT-4 (desenvolvido por OpenAI) e um modelo clínico de código aberto chamado Clinician-LLaMA. A ideia era que os modelos aprendessem a prever se um relatório clínico correspondia a um paciente com diagnóstico de TEA ou não, baseando-se apenas no texto.
Os resultados foram surpreendentes: os modelos alcançaram uma precisão notável na classificação, mesmo quando lhes eram ocultadas informações-chave como o sexo ou a idade do paciente. Isso sugeria que os relatórios continham padrões de linguagem implícitos que os modelos podiam detectar e que refletiam como os clínicos tomam decisões.
O que encontraram?
Além da precisão na predição, o mais interessante foi o que os modelos revelaram sobre o próprio processo diagnóstico. Ao analisar quais fragmentos do texto tinham maior peso nas decisões do modelo, os pesquisadores identificaram que certos tipos de condutas e descrições eram mais determinantes que outros.

Como podemos apreciar no gráfico, os comportamentos repetitivos, estereotipados, os interesses restritos e os aspectos relacionados com a percepção sensorial foram os fatores mais associados a um diagnóstico positivo de TEA. Por outro lado, as dificuldades na interação social, que são um dos pilares tradicionais do diagnóstico segundo o DSM-5, mostraram ter menos peso nos modelos.
Isso não significa que as dificuldades sociais não sejam relevantes, mas que, na prática, os clínicos parecem prestar mais atenção — talvez de forma inconsciente — a outros padrões comportamentais no momento de decidir se um paciente cumpre os critérios diagnósticos.
A seguir, resumem-se os principais resultados do estudo em uma tabela para facilitar sua compreensão:
| Aspecto analizado | Resultado / Observación |
|---|---|
| Modelo utilizado | GPT-4 y Clinician-LLaMA (modelos de linguagem treinados com relatórios clínicos). |
| Fuente de datos | Mais de 40.000 relatórios clínicos pediátricos do sistema de saúde pública de Massachusetts. |
| Tarea del modelo | Prever se o paciente tinha diagnóstico de autismo baseando-se apenas no texto do relatório. |
| Precisión del modelo | Alta, mesmo quando variáveis como sexo ou idade eram ocultadas. |
| Factores más determinantes en el diagnóstico | Comportamentos repetitivos, interesses restritos e traços sensoriais/perceptivos. |
| Factores menos determinantes | Dificuldades na interação social. |
| Implicación clave | Na prática clínica, os comportamentos observáveis influenciam mais do que o esperado. |
| Posible impacto en criterios diagnósticos | Sugere a necessidade de reavaliar o peso de certos critérios no DSM-5. |
| Aplicación de IA en salud mental | Como ferramenta de apoio diagnóstico e análise do raciocínio clínico. |
Como pode ser observado, os modelos de linguagem não apenas conseguiram prever o diagnóstico de TEA com alta precisão, mas também revelaram que certos padrões comportamentais — particularmente os comportamentos repetitivos e os interesses restritos — são mais influentes na prática clínica do que sugerem os critérios diagnósticos tradicionais. Isso abre a porta para uma reflexão sobre como esses critérios são aplicados no contexto real.
Implicações: ¿debemos repensar los criterios diagnósticos del autismo?
Esses achados abrem uma discussão importante: os critérios diagnósticos atuais refletem realmente a forma como os profissionais avaliam os pacientes?
Se os clínicos, de forma sistemática, derem mais importância aos comportamentos observáveis como as estereotipias ou os interesses restritos, pode ser necessário reavaliar o peso atribuído a cada categoria diagnóstica nas diretrizes oficiais.
Além disso, essa abordagem poderia ter implicações para a formação de novos profissionais, que poderiam se beneficiar de entender como os critérios são aplicados na prática real, além da teoria.
A inteligência artificial pode ajudar no diagnóstico clínico de TEA?
Uma das grandes promessas da inteligência artificial no âmbito da saúde é sua capacidade de detectar padrões complexos em grandes volumes de dados. Neste caso, os modelos de linguagem não só atuam como ferramentas de classificação, mas também como instrumentos que nos permitem tornar visível o invisível: a lógica implícita por trás das decisões clínicas.
Longe de substituir os profissionais, esses modelos podem funcionar como aliados, oferecendo uma segunda opinião baseada em milhares de casos anteriores, e ajudando a detectar vieses ou inconsistências nos processos diagnósticos.
Onde a NeuronUP poderia contribuir em estudos como este?
A NeuronUP poderia contribuir significativamente em estudos como este ao facilitar a replicação em populações mais diversas e não falantes de inglês, graças à sua presença internacional. Sua plataforma, com centenas de atividades cognitivas, permitiria complementar a análise de relatórios clínicos com dados estruturados sobre o desempenho cognitivo. Além disso, essa abordagem poderia ser aplicada a outras condições clínicas como o TDAH ou o comprometimento cognitivo leve, melhorando a detecção precoce e a precisão diagnóstica.
Conclusão do estudo
Este estudo marca um marco na interseção entre inteligência artificial e saúde mental. Ao utilizar modelos de linguagem para analisar relatórios clínicos, os pesquisadores não apenas demonstraram que o diagnóstico do autismo pode ser previsto com notável precisão, mas também revelaram como se constrói a “intuição clínica” que orienta essas decisões.
Num futuro próximo, ferramentas como estas poderão ser integradas aos sistemas de saúde para oferecer suporte diagnóstico, melhorar a formação de profissionais, e talvez até redefinir os critérios com os quais entendemos o autismo. O que está claro é que a inteligência artificial não está apenas transformando a tecnologia, mas também a nossa forma de entender a mente humana.
Bibliografia
- Feng S, Sondhi R, Tu X, Buckley J, Sands A, Comiter A, Zhang H, Gao R, Sragovich S, Mello JD, Fedorenko E, Saxe R, Sontheimer EJ, Sapiro G, O’Reilly UM, McCoy TH, Beam AL. Large language models deconstruct the clinical intuition behind diagnosing autism. Cell. 2024 Mar 21. doi: 10.1016/j.cell.2024.03.004.







Deixe um comentário