Como modelos de linguagem identificam sinais de autismo em relatórios clínicos?

Modelos de linguagem foram treinados com mais de 40.000 relatórios pediátricos para prever diagnóstico de TEA a partir do texto, detectando padrões linguísticos implícitos que refletem a intuição clínica.

Que modelos de linguagem foram usados no estudo sobre diagnóstico do TEA?

Foram avaliados GPT‑4 e o modelo clínico de código aberto Clinician‑LLaMA, entre outros, todos treinados com relatórios clínicos para classificar a presença de autismo.

Quais fatores textuais influenciaram mais o diagnóstico segundo os modelos?

Os modelos atribuíram maior peso a comportamentos repetitivos, interesses restritos e traços sensoriais/perceptivos; dificuldades na interação social tiveram menor influência nas previsões.

Os modelos de linguagem podem substituir profissionais no diagnóstico do autismo?

Não substituem profissionais; funcionam como ferramentas de apoio e segunda opinião, ajudando a identificar vieses e inconsistências, enquanto a avaliação clínica especializada permanece essencial.

O estudo indica a necessidade de rever os critérios do DSM‑5 para autismo?

Os achados sugerem reavaliar o peso de certos critérios na prática clínica, mas é necessária validação adicional e debate científico antes de propor alterações no DSM‑5.

Como a NeuronUP poderia contribuir em pesquisas que usam IA para diagnosticar TEA?

A NeuronUP pode facilitar replicações em populações não anglófonas, oferecer dados estruturados de desempenho cognitivo e apoiar estudos comparativos em TDAH e comprometimento cognitivo leve.

Modelos de linguagem para o diagnóstico do autismo

Neste artigo, a doutoranda Marta Arbizu Gómez expõe o estudo «Os grandes modelos linguísticos desconstruem a intuição clínica para diagnosticar o autismo», no qual se explora o impacto da utilização de modelos de linguagem em grande escala para o diagnóstico do autismo.

Introdução

O diagnóstico do transtorno do espectro autista (TEA) tem sido tradicionalmente uma tarefa complexa, que depende em grande medida da experiência clínica, da observação detalhada e da interpretação de comportamentos diversos. Embora existam diretrizes diagnósticas bem definidas como o DSM-5, a prática clínica muitas vezes se guia por uma “intuição” que os profissionais desenvolvem após anos de experiência. Mas o que aconteceria se pudéssemos “ler” essa intuição e entendê-la a partir de uma abordagem mais objetiva?

Um estudo recente publicado na revista Cell, intitulado “Large language models deconstruct the clinical intuition behind diagnosing autism”, explora precisamente essa possibilidade: utilizar modelos de linguagem de grande escala (LLMs, na sigla em inglês) para desvendar os padrões que os clínicos seguem ao diagnosticar o autismo. As descobertas não só são surpreendentes, como também podem ter implicações profundas sobre como entendemos e realizamos os diagnósticos de TEA atualmente.

O contexto: por que é necessário revisar a forma como diagnosticamos o autismo?

O TEA é um transtorno do neurodesenvolvimento caracterizado por desafios na comunicação social e padrões de comportamento e interesses restritos e repetitivos. No entanto, essas características podem se apresentar com grande variabilidade entre indivíduos, o que torna o diagnóstico um processo nuanceado e, por vezes, subjetivo.

Além disso, embora as ferramentas diagnósticas padronizadas como ADOS ou ADI-R ofereçam estrutura ao processo, muitos diagnósticos baseiam-se em relatórios narrativos escritos por clínicos que observaram o paciente. Ou seja, a forma como o clínico descreve o paciente pode ter grande peso no diagnóstico final.

Diante dessa realidade, os pesquisadores se colocaram uma pergunta-chave: quais elementos dentro desses relatórios escritos estão realmente guiando as decisões de diagnóstico?

Inscreva-se
na nossa
Newsletter

O que fizeram os pesquisadores?

Os autores do estudo coletaram mais de 40.000 relatórios clínicos de pacientes infantis do sistema de saúde pública de Massachusetts. Esses relatórios, escritos por profissionais de saúde mental, continham descrições detalhadas do comportamento e do funcionamento dos pacientes.

Com essa base de dados, os pesquisadores treinaram vários modelos de linguagem, incluindo GPT-4 (desenvolvido pela OpenAI) e um modelo clínico de código aberto chamado Clinician-LLaMA. A ideia era que os modelos aprendessem a prever se um relatório clínico correspondia a um paciente com diagnóstico de TEA ou não, baseando-se apenas no texto.

Os resultados foram surpreendentes: os modelos alcançaram uma precisão notável na classificação, mesmo quando se ocultavam informações-chave como o sexo ou a idade do paciente. Isso sugeria que os relatórios continham padrões de linguagem implícitos que os modelos podiam detectar e que refletiam como os clínicos tomam decisões.

O que encontraram?

Além da precisão na predição, o mais interessante foi o que os modelos revelaram sobre o processo diagnóstico em si. Ao analisar quais trechos do texto tinham maior peso nas decisões do modelo, os pesquisadores identificaram que certos tipos de condutas e descrições eram mais determinantes do que outros.

Gráfico circular TEA: fatores de maior peso segundo modelos de linguagem, destacando comportamentos repetitivos e interesses restritos. — Gráfico 1. Fatores com maior peso no diagnóstico de TEA segundo modelos de linguagem. Elaboração própria.

Como podemos observar no gráfico, os comportamentos repetitivos, estereotipados, os interesses restritos e os aspectos relacionados à percepção sensorial foram os fatores mais associados a um diagnóstico positivo de TEA. Por outro lado, as dificuldades na interação social, que são um dos pilares tradicionais do diagnóstico segundo o DSM-5, mostraram ter menos peso nos modelos.

Isso não significa que as dificuldades sociais não sejam relevantes, mas que, na prática, os clínicos parecem prestar mais atenção — talvez de forma inconsciente — a outros padrões comportamentais no momento de decidir se um paciente cumpre os critérios diagnósticos.

A seguir, resumem-se os principais resultados do estudo em uma tabela para facilitar sua compreensão:

Aspecto analisado	Resultado / Observação
Modelo utilizado	GPT-4 e Clinician-LLaMA (modelos de linguagem treinados com relatórios clínicos).
Fonte de dados	Mais de 40.000 relatórios clínicos pediátricos do sistema de saúde pública de Massachusetts.
Tarefa do modelo	Prever se o paciente tinha diagnóstico de autismo com base apenas no texto do relatório.
Precisão do modelo	Alta, mesmo quando se ocultavam variáveis como sexo ou idade.
Fatores mais determinantes no diagnóstico	Comportamentos repetitivos, interesses restritos e traços sensoriais/perceptivos.
Fatores menos determinantes	Dificuldades na interação social.
Implicação chave	Na prática clínica, os comportamentos observáveis influenciam mais do que o esperado.
Possível impacto nos critérios diagnósticos	Sugere necessidade de reavaliar o peso de certos critérios no DSM-5.
Aplicação de IA em saúde mental	Como ferramenta de apoio diagnóstico e análise do raciocínio clínico.

Tabela 1. Resumo com os principais resultados do estudo. Elaboração própria.

Como se pode observar, os modelos de linguagem não só conseguiram prever o diagnóstico de TEA com alta precisão, como também revelaram que certos padrões comportamentais — particularmente os comportamentos repetitivos e os interesses restritos — são mais influentes na prática clínica do que sugerem os critérios diagnósticos tradicionais. Isso abre a porta para uma reflexão sobre como esses critérios são aplicados no contexto real.

Implicações: devemos repensar os critérios diagnósticos do autismo?

Essas descobertas abrem uma discussão importante: os critérios diagnósticos atuais refletem realmente a forma como os profissionais avaliam os pacientes?

Se os clínicos, de forma sistemática, dão mais importância aos comportamentos observáveis como as estereotipias ou os interesses restritos, pode ser necessário reavaliar o peso atribuído a cada categoria diagnóstica nas diretrizes oficiais.

Além disso, essa abordagem poderia ter implicações na formação de novos profissionais, que poderiam se beneficiar de entender como os critérios são aplicados na prática real, além da teoria.

A inteligência artificial pode ajudar no diagnóstico clínico de TEA?

Uma das grandes promessas da inteligência artificial no campo da saúde é sua capacidade de detectar padrões complexos em grandes volumes de dados. Neste caso, os modelos de linguagem não atuam apenas como ferramentas de classificação, mas também como instrumentos que nos permitem fazer visível o invisível: a lógica implícita por trás das decisões clínicas.

Longe de substituir os profissionais, esses modelos podem funcionar como aliados, oferecendo uma segunda opinião baseada em milhares de casos anteriores, e ajudando a detectar vieses ou inconsistências nos processos diagnósticos.

Onde poderia aportar NeuronUP em estudos como este?

A NeuronUP poderia contribuir significativamente a estudos como este ao facilitar a replicação em populações mais diversas e não falantes de inglês, graças à sua presença internacional. Sua plataforma, com centenas de atividades cognitivas, permitiria complementar a análise de relatórios clínicos com dados estruturados sobre desempenho cognitivo. Além disso, essa abordagem poderia ser aplicada a outras condições clínicas como o TDAH ou o comprometimento cognitivo leve, melhorando a detecção precoce e a precisão diagnóstica.

Conclusión del estudio

Este estudo marca um marco na interseção entre inteligência artificial e saúde mental. Ao utilizar modelos de linguagem para analisar relatórios clínicos, os pesquisadores não apenas demonstraram que o diagnóstico do autismo pode ser previsto com notável precisão, como também revelaram como se constrói a “intuição clínica” que orienta essas decisões.

Num futuro próximo, ferramentas como estas poderiam ser integradas aos sistemas de saúde para oferecer suporte diagnóstico, melhorar a formação de profissionais, e talvez até redefinir os critérios com os quais entendemos o autismo. O que está claro é que a inteligência artificial não está apenas transformando a tecnologia, mas também nossa forma de entender a mente humana.

Bibliografía

Feng S, Sondhi R, Tu X, Buckley J, Sands A, Comiter A, Zhang H, Gao R, Sragovich S, Mello JD, Fedorenko E, Saxe R, Sontheimer EJ, Sapiro G, O’Reilly UM, McCoy TH, Beam AL. Large language models deconstruct the clinical intuition behind diagnosing autism. Cell. 2024 Mar 21. doi: 10.1016/j.cell.2024.03.004.