O pesquisador Antonio Javier Sutil Jiménez expõe neste artigo os dados mais relevantes sobre o estudo “Diagnóstico diferencial de etiologias de demência baseado em IA sobre dados multimodais”.
Por que é importante o estudo da demência e da inteligência artificial (IA)?
A população mundial está envelhecendo e, com isso, enfrentamos múltiplos riscos de saúde associados à idade. Um desses riscos são as demências, cujo diagnóstico aumenta cerca de 10 milhões de casos novos a cada ano. As demências são um conjunto de doenças caracterizadas pelo declínio das funções cognitivas a ponto de dificultar ou impossibilitar atividades da vida diária de forma independente. Dentre elas destaca-se a doença de Alzheimer, mas existem muitas outras, como a demência vascular, a demência por corpos de Lewy ou a demência frontotemporal.
Como intervir para reduzir problemas associados às demências?
A resposta estaria relacionada com a obtenção de diagnósticos precoces e precisos que permitam realizar terapias eficazes e especificamente dirigidas a cada doença. Em 2017, a Organização Mundial da Saúde (OMS) já declarou a necessidade de melhorar os diagnósticos para responder ao aumento de casos de demência a nível mundial. No entanto, os diferentes tipos de demência são às vezes dificilmente diferenciáveis em estágios iniciais, já que os sintomas associados a cada demência são complexos. Soma-se a isso o fato de que, por vezes, diferentes demências podem coexistir, o que acarreta um grande número de erros diagnósticos.
Padrão-ouro
Esses diagnósticos basearam-se principalmente em avaliações neuropsicológicas. No entanto, esses diagnósticos baseados em testes cognitivos e comportamentais tentaram ser vinculados a testes que avaliam amostras biológicas, como exames de ressonância, amostras de sangue ou líquido cefalorraquidiano, entre outros. Apesar dos grandes esforços, ainda não existe um teste diagnóstico do tipo “padrão-ouro”. Esse é o nome que denomina um teste diagnóstico que possua alta confiabilidade para diagnosticar uma doença específica. Esse padrão-ouro foi buscado principalmente por meio de dados biológicos, sem sucesso até o momento.
Solução baseada em inteligência artificial (IA)
Para resolver essa situação, um grupo de pesquisadores da Universidade de Boston juntamente com pesquisadores de todos os Estados Unidos propuseram uma solução baseada em inteligência artificial que permitiria trabalhar com um grande conjunto de dados de caráter heterogêneo. Esses dados são heterogêneos porque se baseiam em imitar o mundo real; ou seja, utilizar as mesmas ferramentas que um profissional clínico usaria para dar uma solução ao problema de diagnóstico e prevenção relacionado às demências. Os múltiplos tipos de dados abordados foram: sociodemográficos, neurológicos, físicos, histórico médico e exames de ressonância.
O que foi feito?
Para poder aplicar um modelo baseado em inteligência artificial era necessária uma quantidade massiva de dados, por isso os pesquisadores recorreram a nove conjuntos de dados independentes reunindo mais de 51.000 pacientes com diferentes tipos de demência.
Pacientes com diferentes tipos de demência
A inclusão de um amplo espectro de demências e com causas múltiplas foi um passo fundamental para obter uma caracterização rica e variada que possa ser representativa da realidade. Por isso foram incluídos pacientes com demência devido a muitas causas diferentes, como Alzheimer, acidentes vasculares cerebrais, com degeneração frontotemporal, degeneração corticobasal, devido a infecções, abuso de drogas, etc.
Problema de perda de dados
No entanto, essa abordagem baseada em uma quantidade massiva de dados também torna provável que haja dados ausentes. Este é o caso oposto a ambientes muito controlados e com um número mais reduzido de pacientes, nos quais a perda de dados é minimizada. Nesse cenário, a abordagem requer grandes conjuntos de dados muito heterogêneos que permitam ao modelo aprender e ser o mais realista possível. Para resolver o problema relacionado à perda de dados, os pesquisadores aplicaram técnicas que proporcionarão a máxima robustez durante as primeiras etapas. A implementação desses métodos e estratégias robustas evita que o treinamento da inteligência artificial fique enviesado e, portanto, que as futuras previsões também o sejam. Além disso, seguiram-se procedimentos padronizados de inclusão e exclusão que asseguraram a consistência e credibilidade dos resultados.
Modelo do tipo “transformer”
Nesse ponto, também surge um importante desafio: a criação de um modelo que permita agregar múltiplos tipos de dados e parâmetros de diferente natureza, o que se denomina uma arquitetura do tipo “transformer”. Nesse tipo de modelo, todas as características diferentes incluídas são transformadas no que se chama um “vetor de comprimento fixo”, seguindo uma estratégia específica que permite criar uma primeira camada do modelo sobre a qual o restante será construído, decodificando isso em uma série de previsões.
Para entendê-lo melhor, podemos pensar nesse modelo como em uma receita de cozinha, só que em vez de diferentes passos como em uma receita, o modelo terá diferentes camadas. Mas da mesma forma que, para obter um bom prato após cozinhar, precisamos de bons ingredientes que combinem de maneira adequada, os pesquisadores queriam um bom sistema de classificação dos pacientes e precisavam que seus ingredientes — ou seja, os dados iniciais — fossem bons e pudessem ser combinados adequadamente. No nosso paralelo com esse modelo de inteligência artificial, seria transformar os diferentes dados que temos em um formato comum (vetor de comprimento fixo). Por isso, o modelo criado será muito robusto diante da perda ou incompletude de dados e poderá realizar previsões confiáveis.
Aprendizado auto-supervisionado
Especificamente, eles utilizam um tipo de modelo denominado de aprendizado auto-supervisionado. Neste enfoque de aprendizado de máquina, o modelo aprende a partir de dados sem a necessidade de rótulos explícitos. Ao contrário do aprendizado supervisionado, que requer um conjunto de dados rotulado, o aprendizado auto-supervisionado baseia-se em encontrar estruturas e padrões nos dados sem a intervenção humana direta para rotulá-los.
Fase de treinamento, validação e comparação com especialistas
O que veio a seguir no desenvolvimento do modelo foi a fase de treinamento, validação e comparação com especialistas. Os processos de treinamento e validação são habituais nesse tipo de estudo.
O treinamento consistiu em alimentar o modelo utilizando dados das diferentes coortes, integrando todas as modalidades para aprender padrões associados a diferentes tipos de demência. Após o treinamento do modelo realizou-se a validação, que é a utilização de dados não vistos previamente, para assegurar que o modelo pode generalizar suas previsões para dados desconhecidos.
Por fim, e de forma inovadora, os pesquisadores testaram os diagnósticos realizados pelo modelo com médicos especializados no diagnóstico de demências. Para isso, convidaram um grupo de 12 neurologistas e 7 neurorradiologistas para participar de tarefas de diagnóstico de um subconjunto de 100 casos com diferentes tipos de demência. Foram fornecidos os dados disponíveis para cada um desses 100 casos e pediu-se que fornecessem suas impressões diagnósticas, bem como uma pontuação de confiança que variava entre 0 e 100 para o diagnóstico de cada uma das 13 etiquetas possíveis. Nesse ponto, quis-se saber se os julgamentos clínicos poderiam ser melhorados utilizando o modelo criado.

Inscreva-se
na nossa
Newsletter
Quais são as principais conclusões deste estudo sobre demência e inteligência artificial (IA)?
Os resultados principais podem ser divididos em três partes: classificação saudáveis vs comprometimento, classificação das patologias e a melhoria do critério clínico usando o modelo.
O estudo avaliou o desempenho de um modelo de inteligência artificial (IA) para classificar indivíduos em três categorias cognitivas:
- saudáveis ou cognitivamente normais,
- comprometimento cognitivo leve
- e demência.
As métricas usadas para avaliar o desempenho do modelo foram curvas ROC e PR. Os resultados obtidos podem ser observados na seguinte (tabela 1).
- As métricas obtidas para os modelos ROC refletem uma alta capacidade do modelo para diferenciar as três classes mencionadas, já que essas métricas são avaliadas de 0 a 1, sendo um valor próximo de um indicativo de uma excelente classificação.
- Para as métricas AUAP os valores continuam indicando um bom desempenho do modelo, sendo preciso considerar cada classe.
| AUROC | AUAP | |
| Micro | 0.94 | 0.90 |
| Macro | 0.93 | 0.84 |
| Weight | 0.94 | 0.87 |
O segundo resultado do estudo relacionou-se com a capacidade do modelo para diagnosticar dez diferentes tipos de demência, mostrando resultados muito significativos quanto à sua precisão diagnóstica.
- Os resultados das métricas AUROC novamente mostram grande eficácia do modelo, sendo este capaz de distinguir na maioria das ocasiões entre os tipos de demência.
- Por outro lado, os modelos AUPR continuam mostrando que o modelo tem bom desempenho, embora não excelente (ver tabela 2), o que indicaria que o modelo é mais preciso em algumas doenças do que em outras.
| AUROC | AP | |
| Micro | 0.96 | 0.70 |
| Macro | 0.90 | 0.36 |
| Weight | 0.94 | 0.73 |
Por fim, em relação à avaliação clínica assistida por IA, os resultados indicam que poderia aumentar a precisão diagnóstica comparada àquela realizada por um profissional clínico sozinho. Isso é visível pela melhoria significativa na classificação dos tipos de demências. Por exemplo:
Os neurologistas melhoraram:
- 12% na detecção do comprometimento cognitivo leve,
- 15% na do Alzheimer,
- 26% para a demência frontotemporal seguindo os valores AUROC.
- especialmente relevante foi a melhoria para a doença priônica que melhorou 73%.
Os radiologistas:
- para a demência tipo Alzheimer melhoraram 9%
- 6% para demência frontotemporal,
- destacável também a melhoria para a doença priônica com 68%.
Como conclusão, podemos extrair que futuros modelos baseados em inteligência artificial poderiam ser de grande ajuda para a diferenciação diagnóstica quando esta se baseia na natureza multifatorial dos diferentes tipos de demência. Isso poderia não apenas melhorar o diagnóstico, mas também facilitar a personalização de tratamentos e intervenções em estágios iniciais da doença.
Onde a NeuronUP poderia contribuir em um estudo como este?
A partir da NeuronUP é possível contribuir de diversas formas em um estudo como este.
- Da NeuronUP pode-se contribuir na implementação de estruturas e tecnologias que permitiriam replicar ou reproduzir um estudo dessas características, dado que os conjuntos de dados usados são de uso livre.
- Poder-se-ia replicar o estudo ou reproduzi-lo utilizando um procedimento diferente que fosse mais preciso ou menos custoso.
- Além disso, poderiam ser aplicadas técnicas e modelos que permitam ser mais precisos e diferenciar que tipos de dados mais contribuem para o modelo ou se se podem obter boas métricas de classificação com apenas um tipo de dado. Um exemplo disso seria utilizar dados neuropsicológicos e sociodemográficos para tentar obter resultados similares.
- Por outro lado, a NeuronUP conta com um grande banco de dados de caráter neurocognitivo, pelo que poderia tentar-se realizar classificações semelhantes que apurassem em que aspectos de caráter neurocognitivo poderiam facilitar uma detecção precoce e a predição do comprometimento. Isso é especialmente relevante dado que as demências continuam a ter um caráter neuropsicológico e de afetação comportamental muito relevante. Nos últimos anos, foram feitos grandes progressos na busca por biomarcadores, mas a qualidade de vida do paciente continua sendo primordial e a maior preocupação para ele e seus entes queridos. Assim, uma maior precisão nessa área ou a elaboração de um perfil cognitivo com base em testes cognitivos poderia ser de grande utilidade.
- Continuando com o aspecto neurocognitivo, já que este não é amplamente abordado no artigo, poderia fazer-se uso das grandes bases de dados de que a NeuronUP dispõe para reproduzir o estudo com uma nova coorte de pacientes. Além disso, o tipo de dados neuropsicológicos usados no estudo não é descrito; podem existir diferentes domínios cognitivos que sejam mais relevantes.
Pesquisador principal: O Dr. Vijaya B. Kolachalama é professor associado da Universidade de Boston e pesquisador principal do Kolachalama Lab nessa mesma universidade. Seu trabalho dirige-se principalmente à aplicação de inteligência artificial a problemas médicos, tendo como missão criar ferramentas que ajudem os neurologistas em cenários reais, principalmente em doenças neurodegenerativas.
Bibliografia
- Xue, C., Kowshik, S.S., Lteif, D. et al. “Diagnóstico diferencial de etiologias de demência baseado em IA sobre dados multimodais”. Nat Med (2024). https://doi.org/10.1038/s41591-024-03118-z







Sessão de linguagem para pessoas com comprometimento cognitivo leve
Deixe um comentário