O que é o estudo sobre diagnóstico diferencial de demência com IA?

Estudo que aplica inteligência artificial para realizar diagnóstico diferencial de etiologias de demência usando dados multimodais, com objetivo de obter diagnósticos precoces, reduzir erros e orientar tratamentos específicos.

Como a IA usa dados multimodais no diagnóstico de demência?

Integra sociodemográficos, dados neurológicos, históricos clínicos e exames (como ressonância), convertendo-os em vetores de comprimento fixo para classificação, tolerando ausência de informações e refletindo prática clínica.

Qual o papel do modelo transformer e do aprendizado auto‑supervisionado?

Arquitetura tipo transformer agrega características heterogêneas em vetores fixos; aprendizado auto‑supervisionado identifica padrões sem rótulos, aumentando robustez e capacidade de generalização em grandes bases de dados.

Quantos e quais conjuntos de dados foram utilizados?

Foram reunidos nove conjuntos de dados independentes com mais de 51.000 pacientes, incluindo casos de Alzheimer, demência vascular, frontotemporal, corpos de Lewy, príons e outras etiologias.

Como foi a validação com especialistas e quais os resultados principais?

Comparou‑se o modelo com 12 neurologistas e 7 neurorradiologistas em 100 casos; desempenho AUROC micro≈0,94 e macro≈0,93. A IA melhorou acurácia clínica (ex.: +15% Alzheimer, +26% FTD, +73% príons).

Como a NeuronUP pode contribuir em estudos de IA para demência?

Pode oferecer infraestrutura, reproduzir estudos, aplicar modelos com dados neuropsicológicos e usar seu banco neurocognitivo para identificar domínios cognitivos relevantes na detecção precoce e predição do comprometimento.

Diagnóstico de demência baseado em IA

O pesquisador Antonio Javier Sutil Jiménez expõe neste artigo os dados mais relevantes sobre o estudo “Diagnóstico diferencial de etiologias de demência baseado em IA sobre dados multimodais”.

Por que é importante o estudo de demência e inteligência artificial (IA)?

A população mundial está envelhecendo e, com isso, enfrentamos múltiplos riscos de saúde associados à idade. Um desses riscos são as demências, cujo diagnóstico aumenta em cerca de 10 milhões de novos casos a cada ano. As demências são um conjunto de doenças que se caracterizam pelo declínio das funções cognitivas até o ponto de dificultar ou impossibilitar as atividades da vida diária de forma independente. Entre elas destaca-se a doença de Alzheimer, mas existem muitas outras como a demência vascular, a demência por corpos de Lewy ou a demência frontotemporal.

Como intervir para reduzir os problemas associados às demências?

A resposta estaria relacionada com a obtenção de diagnósticos precoces e precisos que permitam realizar terapias eficazes e especificamente dirigidas a cada doença. Em 2017, a Organização Mundial da Saúde (OMS) já declarou a necessidade de melhorar os diagnósticos para responder ao aumento de casos de demência a nível mundial. No entanto, os diferentes tipos de demência são às vezes dificilmente diferenciáveis em estágios iniciais já que os sintomas associados a cada demência são complexos. Soma-se a isso que, às vezes, as diferentes demências podem coexistir, o que acarreta um grande número de erros de diagnóstico.

Padrão-ouro

Esses diagnósticos foram baseados principalmente em avaliações neuropsicológicas. No entanto, esses diagnósticos baseados em testes cognitivos e comportamentais tentaram ser vinculados a testes que avaliem amostras biológicas como podem ser exames de ressonância, amostras de sangue ou líquido cefalorraquidiano, entre outros. Apesar da realização de grandes esforços, ainda não existe um exame diagnóstico do tipo “Padrão-ouro”. Este é o nome que denomina um teste de diagnóstico que possua alta confiabilidade na hora de diagnosticar uma doença concreta. Este Padrão-ouro foi buscado principalmente através dos dados biológicos sem sucesso até o momento.

Solução baseada em inteligência artificial (IA)

Para contornar essa situação, um grupo de pesquisadores da Universidade de Boston junto a pesquisadores de todos os Estados Unidos propôs uma solução baseada em inteligência artificial que permitiria trabalhar com um grande conjunto de dados de caráter heterogêneo. Esses dados são heterogêneos porque se baseiam em imitar o mundo real; isto é, utilizar as mesmas ferramentas que um profissional clínico utilizaria para dar uma solução ao problema de diagnóstico e prevenção que existe em relação às demências. Os múltiplos tipos de dados que abordaram são: sociodemográficos, neurológicos, físicos, histórico médico e exames de ressonância.

O que foi feito?

Para poder aplicar um modelo baseado em inteligência artificial era necessária uma quantidade massiva de dados, por isso os pesquisadores recorreram a nove conjuntos de dados independentes reunindo mais de 51.000 pacientes com diferentes tipos de demência.

Pacientes com diferentes tipos de demência

A inclusão de um amplo leque de demências e com causas múltiplas foi um passo fundamental para obter uma caracterização rica e variada que possa ser representativa da realidade. Por isso foram incluídos pacientes que tinham demência devido a muitas causas diferentes como Alzheimer, acidentes cerebrovasculares, com degeneração frontotemporal, degeneração corticobasal, devido a infecções, abuso de drogas, etc.

Problema de perda de dados

No entanto, essa abordagem baseada em uma quantidade massiva de dados também torna provável que haja dados perdidos. Este é o caso contrário a ambientes muito controlados e com um número mais reduzido de pacientes, nos quais se minimiza a perda de dados. Neste caso, o enfoque precisa de grandes conjuntos de dados muito heterogêneos que permitam ao modelo aprender e ser o mais realista possível. Para resolver o problema relacionado com a perda de dados, os pesquisadores aplicaram técnicas que proporcionarão a máxima robustez durante as primeiras etapas. A implantação desses métodos e estratégias robustas evita que o treinamento da inteligência artificial fique enviesado e, consequentemente, que também o sejam as futuras previsões. Além disso, seguiram-se procedimentos padronizados de inclusão e exclusão que asseguraram a consistência e credibilidade dos resultados.

Modelo de tipo “transformer”

Nesse ponto, também se apresenta um importante desafio que é a criação de um modelo que permita agregar múltiplos tipos de dados e parâmetros de diferente natureza, o que se denomina uma arquitetura do tipo “transformer”. Nesse tipo de modelo, todas as características diferentes incluídas são transformadas no que se denomina um “vetor de comprimento fixo” seguindo uma estratégia específica que permite criar uma primeira camada do modelo sobre a qual será construído o restante, decodificando isso em uma série de previsões.

Para entendê-lo melhor, podemos pensar neste modelo como uma receita de cozinha, só que em vez de diferentes passos como temos na receita, o modelo terá diferentes camadas. Mas, da mesma forma que para obter um bom prato após cozinhar precisamos de bons ingredientes que combinem de forma adequada. Os pesquisadores queriam um bom sistema de classificação dos pacientes e precisavam que seus ingredientes; ou seja, os dados de partida, fossem bons e pudessem ser combinados adequadamente. No nosso símile com este modelo de inteligência artificial seria transformar os diferentes dados que temos em um formato comum (vetor de comprimento fixo). Por causa disso, o modelo criado será muito robusto perante a perda ou incompletude de dados e poderá realizar previsões confiáveis.

Aprendizado auto-supervisionado

Em concreto, eles utilizam um tipo de modelo denominado de aprendizado auto-supervisionado. Neste enfoque de aprendizado de máquina, o modelo aprende a partir de dados sem a necessidade de rótulos explícitos. Ao contrário do aprendizado supervisionado, que requer um conjunto de dados com rótulos, o aprendizado auto-supervisionado baseia-se em encontrar estruturas e padrões nos dados sem a intervenção humana direta para rotulá-los.

Fase de treinamento, validação e comparação com especialistas

O que veio a seguir no desenvolvimento do modelo foi a fase de treinamento, validação e comparação com especialistas. Os processos de treinamento e validação são habituais neste tipo de estudo.

O treinamento consistiu em alimentar o modelo utilizando dados das diferentes coortes, integrando todas as modalidades para aprender padrões associados com diferentes tipos de demência. Posteriormente ao treinamento do modelo realizou-se a validação, que é a utilização de dados não vistos previamente, para assegurar que o modelo pode generalizar suas previsões para dados que desconhece.

Por fim, e de forma inovadora, os pesquisadores compararam os diagnósticos realizados pelo modelo com médicos especializados no diagnóstico de demências. Para tal, convidaram um grupo de 12 neurologistas e 7 neurorradiologistas a participar em tarefas de diagnóstico de um subconjunto de 100 casos com diferentes tipos de demência. Foram fornecidos os dados disponíveis para cada um desses 100 casos e pediram-lhes que apresentassem suas impressões diagnósticas, assim como uma pontuação de confiança que variava entre 0 e 100 para o diagnóstico de cada uma das 13 etiquetas possíveis. Nesse ponto, queria-se saber se os julgamentos clínicos poderiam ser melhorados utilizando o modelo criado.

Inscreva-se
na nossa
Newsletter

Quais são as principais conclusões deste estudo de demência e inteligência artificial (IA)?

Os principais resultados podem ser divididos em três partes: classificação saudáveis vs comprometimento, classificação das patologias e a melhoria do critério clínico usando o modelo.

O estudo avaliou o desempenho de um modelo de inteligência artificial (IA) para classificar indivíduos em três categorias cognitivas:

saudáveis ou cognitivamente normais,
comprometimento cognitivo leve
e demência.

As métricas utilizadas para avaliar o desempenho do modelo foram curvas ROC e PR. Os resultados obtidos podem ser observados na seguinte (tabela 1).

As métricas obtidas para os modelos ROC refletem uma alta capacidade do modelo para diferenciar as três classes mencionadas, pois essas métricas são avaliadas de 0 a 1, sendo um valor próximo de um indicativo de uma excelente classificação.
Para as métricas AUAP os valores continuam indicando um bom desempenho do modelo, sendo necessário considerar cada classe.

	AUROC	AUAP
Micro	0.94	0.90
Macro	0.93	0.84
Weight	0.94	0.87

Tabela 1. Desempenho do modelo para a classificação saudável vs. deterioração.

O segundo resultado do estudo se relacionou com a capacidade do modelo para diagnosticar dez diferentes tipos de demência, mostrando resultados muito significativos quanto à sua precisão diagnóstica.

Os resultados das métricas AUROC novamente mostram uma grande eficácia do modelo, sendo este capaz de distinguir na maioria das ocasiões entre os tipos de demência.
Por outro lado, os modelos AUPR continuam mostrando que o modelo tem um bom desempenho, embora não excelente (ver tabela 2), o que indicaria que o modelo é mais preciso em algumas doenças do que em outras.

	AUROC	AP
Micro	0.96	0.70
Macro	0.90	0.36
Weight	0.94	0.73

Tabela 2. Média do desempenho do modelo para classificar demências.

Por fim, em relação à avaliação clínica assistida por IA, os resultados indicam que poderia aumentar a precisão diagnóstica em comparação com a realizada por um profissional clínico sozinho. Isso é visível pela melhoria significativa na classificação dos tipos de demência. Por exemplo:

Os neurologistas melhoraram:

12% na detecção do comprometimento cognitivo leve,
15% na detecção do Alzheimer,
26% para a demência frontotemporal seguindo os valores AUROC.
especialmente relevante foi a melhoria para a doença por príons que melhorou 73%.

Os radiologistas:

para a demência tipo Alzheimer melhoraram 9%
6% para demência frontotemporal,
destaque também para a melhoria na doença por príons com 68%.

Como conclusão, podemos extrair que futuros modelos baseados em inteligência artificial poderiam ser de grande ajuda para a diferenciação diagnóstica quando esta se baseia na natureza multifatorial dos diferentes tipos de demência. Isso poderia não só melhorar o diagnóstico como também facilitar a personalização de tratamentos e intervenções em estados precoces da doença.

Onde a NeuronUP poderia contribuir em um estudo como este?

A partir da NeuronUP é possível contribuir de diversas maneiras em um estudo como este.

A partir da NeuronUP pode-se contribuir na implementação de estruturas e tecnologias que permitiriam replicar ou reproduzir um estudo com essas características, dado que os conjuntos de dados usados são de livre uso.
Poderia-se replicar o estudo ou reproduzi-lo utilizando um procedimento diferente que fosse mais preciso ou menos custoso.
Além disso, poderiam ser aplicadas técnicas e modelos que permitam ser mais precisos e diferenciar quais tipos de dados mais contribuem para o modelo ou se é possível obter boas métricas de classificação com apenas um tipo de dado. Um exemplo disso seria utilizar dados neuropsicológicos e sociodemográficos para tentar obter resultados semelhantes.
Por outro lado, a NeuronUP conta com um grande banco de dados de caráter neurocognitivo, pelo que poderia-se tentar realizar classificações similares que afiem em quais aspectos neurocognitivos poderiam facilitar uma detecção precoce e a predição do comprometimento. Isso é especialmente relevante dado que as demências continuam a ter um caráter neuropsicológico e de afetacão comportamental muito relevante. Nos últimos anos, foram feitos grandes progressos na busca por biomarcadores, mas a qualidade de vida do paciente continua a ser primordial e a maior preocupação para ele e seus entes queridos. Assim, uma maior precisão nessa área ou a elaboração de um perfil cognitivo com base em testes cognitivos poderia ser de grande utilidade.
Continuando com o aspecto neurocognitivo, já que este não está amplamente abordado no artigo, poderia-se fazer uso das grandes bases de dados que a NeuronUP possui para reproduzir o estudo com uma nova coorte de pacientes. Além disso, o tipo de dados neuropsicológicos usados no estudo não é descrito; podem existir diferentes domínios cognitivos que sejam mais relevantes.

Investigador principal: O Dr. Vijaya B. Kolachalama é professor associado da Universidade de Boston e investigador principal do Kolachalama Lab nessa mesma universidade. Seu trabalho é dirigido principalmente à aplicação de inteligência artificial a problemas médicos, tendo como missão criar ferramentas que auxiliem os neurologistas em cenários reais, principalmente em doenças neurodegenerativas.

Bibliografia

Xue, C., Kowshik, S.S., Lteif, D. et al. “Diagnóstico diferencial de etiologias de demência baseado em IA sobre dados multimodais”. Nat Med (2024). https://doi.org/10.1038/s41591-024-03118-z