Neste artigo, o pesquisador Antonio Javier Sutil Jiménez apresenta os dados mais relevantes do estudo “Diagnóstico diferencial de etiologias de demência baseado em IA em dados multimodais”.
Por que o estudo da demência e da inteligência artificial (IA) é importante?
A população mundial está envelhecendo e com isso enfrentamos múltiplos riscos para a saúde associados à idade. Um desses riscos é a demência, cujo diagnóstico aumenta em quase 10 milhões de novos casos a cada ano. As demências são um grupo de doenças que se caracterizam pela deterioração das funções cognitivas ao ponto de dificultar ou impossibilitar as atividades da vida diária de forma independente. Entre estas destaca-se a doença de Alzheimer, mas existem muitas outras como a demência vascular, a demência com corpos de Lewy ou a demência frontotemporal.
Como intervir para reduzir os problemas associados à demência?
A resposta estaria relacionada com a obtenção de diagnósticos precoces e precisos que permitam terapêuticas eficazes especificamente dirigidas a cada doença. Em 2017, a Organização Mundial de Saúde (OMS) já declarava a necessidade de melhorar os diagnósticos para responder ao aumento dos casos de demência em todo o mundo. No entanto, os diferentes tipos de demência são por vezes difíceis de diferenciar nas fases iniciais, uma vez que os sintomas associados a cada demência são complexos. Por isso, às vezes, podem coexistir diferentes demências, o que leva a um grande número de erros de diagnóstico.
Gold Standard
Esses diagnósticos foram baseados principalmente em avaliações neuropsicológicas. No entanto, estes diagnósticos baseados em testes cognitivos e comportamentais têm tentado ser associados a testes que avaliam amostras biológicas, como ressonâncias magnéticas, amostras de sangue ou líquido cefalorraquidiano, entre outros. Apesar dos grandes esforços, ainda falta um teste diagnóstico do tipo “Gold Standard”. É o nome dado a um exame diagnóstico que apresenta alta confiabilidade no diagnóstico de uma doença específica. Este Padrão Ouro tem sido perseguido principalmente através de dados biológicos, sem sucesso até agora.
Solução baseada em inteligência artificial (IA)
Para resolver esta situação, um grupo de investigadores da Universidade de Boston em conjunto com investigadores de todos os Estados Unidos propuseram uma solução baseada em inteligência artificial que permitiria trabalhar com um grande conjunto de dados heterogéneos. Esses dados são heterogêneos porque se baseiam na imitação do mundo real; Ou seja, utilizam as mesmas ferramentas que um profissional clínico utilizaria para solucionar o problema de diagnóstico e prevenção que existe em relação à demência. Os múltiplos tipos de dados abordados são: sociodemográficos, neurológicos, físicos, histórico médico e exames de ressonância magnética.
Descubra milhares de exercícios
a mais em nossa plataforma
O que foi feito?
Para aplicar um modelo baseado em inteligência artificial, foi necessária uma enorme quantidade de dados, por isso os investigadores recorreram a nove conjuntos de dados independentes, reunindo mais de 51 mil pacientes com diferentes tipos de demência.
Pacientes com diferentes tipos de demência
A inclusão de uma ampla gama de demências com múltiplas causas foi um passo fundamental para obter uma caracterização rica e variada que possa ser representativa da realidade. Portanto, foram incluídos pacientes que apresentavam demência por diversas causas, como Alzheimer, acidente vascular cerebral, com degeneração frontotemporal, degeneração corticobasal, por infecções, abuso de drogas, etc.
Problema de perda de dados
No entanto, esta abordagem baseada numa enorme quantidade de dados também torna provável que haja dados em falta. Isto é o oposto de ambientes altamente controlados e com menor número de pacientes, nos quais a perda de dados é minimizada. Neste caso, a abordagem requer conjuntos de dados grandes e muito heterogêneos que permitam que o modelo aprenda e seja o mais realista possível. Para resolver o problema relacionado à perda de dados, os pesquisadores aplicaram técnicas que proporcionarão o máximo de robustez nas fases iniciais. A implementação destes métodos e estratégias robustos evita que o treino da inteligência artificial seja tendencioso e, portanto, também as previsões futuras. Além disso, foram seguidos procedimentos padronizados de inclusão e exclusão que garantiram a consistência e credibilidade dos resultados.
Modelo tipo transformador
Neste ponto surge também um importante desafio que é a criação de um modelo que permita aglomerar múltiplos tipos de dados e parâmetros de diferentes naturezas, o que se denomina arquitetura do tipo “transformador”. Neste tipo de modelo, todas as diferentes características incluídas são tomadas e transformadas no que se denomina “vetor de comprimento fixo” seguindo uma estratégia específica que permite criar uma primeira camada do modelo sobre a qual o resto será construído, decodificando-o em um série de previsões.
Para entender melhor, podemos pensar neste modelo como uma receita culinária, só que em vez de etapas diferentes como temos na receita, o modelo terá camadas diferentes. Assim como para preparar um bom prato é necessário usar bons ingredientes que se combinem bem, precisamos garantir que tudo esteja em harmonia. Os pesquisadores queriam um bom sistema de classificação de pacientes e precisavam de seus ingredientes; Ou seja, os dados a partir dos quais partiram eram bons e podiam ser combinados de forma adequada. Na nossa comparação com este modelo de inteligência artificial seria transformar os diferentes dados que temos num formato comum (vetor de comprimento fixo). Devido a isso, o modelo criado será muito robusto à perda ou incompletude de dados e será capaz de fazer previsões confiáveis.
Aprendizagem auto-supervisionada
Especificamente, eles usam um tipo de modelo denominado aprendizagem auto-supervisionada. Nesta abordagem de aprendizado de máquina, o modelo aprende com os dados sem a necessidade de rótulos explícitos. Ao contrário da aprendizagem supervisionada, que requer um conjunto de dados rotulados, a aprendizagem auto-supervisionada depende da descoberta de estruturas e padrões nos dados sem intervenção humana directa para os rotular.
Fase de treinamento, validação e comparação com especialistas
O que se seguiu no desenvolvimento do modelo foi a fase de treinamento, validação e comparação com especialistas. Processos de treinamento e validação são comuns nesse tipo de estudo.
A formação consistiu em alimentar o modelo com dados das diferentes coortes, integrando todas as modalidades para aprender padrões associados aos diferentes tipos de demência. Após o treinamento do modelo, foi realizada a validação, que é a utilização de dados inéditos, para garantir que o modelo possa generalizar suas previsões para dados desconhecidos.
Por fim, e de forma inédita, os pesquisadores testaram os diagnósticos feitos pelo modelo com médicos especializados no diagnóstico de demência. Para isso, convidaram um grupo de 12 neurologistas e 7 neurorradiologistas para participarem em tarefas de diagnóstico de um subconjunto de 100 casos com diferentes tipos de demência. Eles receberam os dados disponíveis para cada um desses 100 casos e foram solicitados a fornecer suas impressões diagnósticas, bem como uma pontuação de confiança que variava de 0 a 100 para o diagnóstico de cada um dos 13 rótulos possíveis. Neste ponto queríamos saber se os julgamentos clínicos poderiam ser melhorados usando o modelo criado.
Quais são as principais conclusões deste estudo sobre demência e inteligência artificial (IA)?
Os principais resultados podem ser divididos em três partes: classificação saudável vs deterioração, classificação de patologias e melhoria do julgamento clínico utilizando o modelo.
O estudo avaliou o desempenho de um modelo de inteligência artificial (IA) para classificar indivíduos em três categorias cognitivas:
- saudável ou cognitivamente norma;,
- comprometimento cognitivo leve;
- e demência.
As métricas utilizadas para avaliar o desempenho do modelo foram curvas ROC e PR. Os resultados obtidos podem ser observados a seguir (Tabela 1).
- As métricas obtidas para os modelos ROC refletem uma elevada capacidade do modelo em diferenciar as três classes mencionadas, uma vez que estas métricas são avaliadas de 0 a 1, sendo um valor próximo de um indicativo de uma classificação excelente.
- Para as métricas AUAP, os valores continuam indicando bom desempenho do modelo, e cada classe deve ser considerada.
AUROC | AUAP | |
Micro | 0.94 | 0.90 |
Macro | 0.93 | 0.84 |
Weight | 0.94 | 0.87 |
O segundo resultado do estudo esteve relacionado com a capacidade do modelo em diagnosticar dez tipos diferentes de demência, apresentando resultados muito significativos em termos de precisão diagnóstica.
- Os resultados das métricas AUROC mostram novamente grande eficácia do modelo, sendo capaz de distinguir entre tipos de demência na maioria dos casos.
- Por outro lado, os modelos AUPR continuam a mostrar que o modelo tem um desempenho bom, embora não excelente (ver Tabela 2), o que indicaria que o modelo é mais preciso em algumas doenças do que noutras.
AUROC | AP | |
Micro | 0.96 | 0.70 |
Macro | 0.90 | 0.36 |
Weight | 0.94 | 0.73 |
Por fim, em relação à avaliação clínica assistida por IA, os resultados indicam que ela poderia aumentar a precisão diagnóstica em comparação com o que um profissional clínico faria sozinho. Isto é visível pela melhoria significativa na classificação dos tipos de demência. Por exemplo:
Os neurologistas melhoraram:
- 12% na detecção de comprometimento cognitivo leve,
- 15% na doença de Alzheimer,
- 26% para demência frontotemporal seguindo valores AUROC.
- Especialmente relevante foi a melhoria da doença por priões, que melhorou 73%.
Os radiologistas:
- para a demência de Alzheimer melhorou em 9%
- 6% para demência frontotemporal,
- Destaca-se também a melhora da doença por príon com 68%.
Concluindo, podemos extrair que futuros modelos baseados em inteligência artificial poderão ser de grande ajuda para a diferenciação diagnóstica quando esta se basear na natureza multifatorial dos diferentes tipos de demência. Isto poderia não só melhorar o diagnóstico, mas também facilitar a personalização de tratamentos e intervenções nas fases iniciais da doença.
Inscreva-se
na nossa
Newsletter
Onde a NeuronUP poderia contribuir para um estudo como este?
A NeuronUP pode contribuir de diversas maneiras para um estudo como este.
- NeuronUP pode contribuir para a implementação de estruturas e tecnologias que permitam replicar ou reproduzir um estudo destas características, uma vez que os conjuntos de dados utilizados são de utilização gratuita.
- O estudo poderia ser replicado ou reproduzido por meio de um procedimento diferente, mais preciso ou menos dispendioso.
- Além disso, poderiam ser aplicadas técnicas e modelos que nos permitam ser mais precisos e diferenciar quais tipos de dados contribuem mais para o modelo ou se podem ser obtidas boas métricas de classificação do que apenas um tipo de dados. Um exemplo disso seria utilizar dados neuropsicológicos e sociodemográficos para tentar obter resultados semelhantes.
- Por outro lado, a NeuronUP possui um grande banco de dados neurocognitivos, portanto classificações semelhantes poderiam ser tentadas para refinar quais aspectos neurocognitivos poderiam facilitar a detecção precoce e a previsão da deterioração. Isto é especialmente relevante dado que as demências continuam a ter um impacto neuropsicológico e comportamental muito relevante. Nos últimos anos, grandes avanços foram feitos na busca por biomarcadores, mas a qualidade de vida do paciente continua sendo primordial e a maior preocupação para ele e seus entes queridos. Portanto, uma maior precisão nesta seção ou o desenvolvimento de um perfil cognitivo baseado em testes cognitivos poderia ser muito útil.
- Continuando com a seção neurocognitiva, por não ser amplamente abordada no artigo, poderia ser feito uso dos grandes bancos de dados que a NeuronUP possui para reproduzir o estudo com uma nova coorte de pacientes. Além disso, o tipo de dados neuropsicológicos utilizados no estudo não está descrito, podendo haver diferentes domínios cognitivos mais relevantes.
Investigador Principal: Dr. Vijaya B. Kolachalama é professor associado da Universidade de Boston e investigador principal do Laboratório Kolachalama da Universidade de Boston. Seu trabalho visa principalmente a aplicação de inteligência artificial a problemas médicos. Sua missão é criar ferramentas que auxiliem neurologistas em cenários reais, principalmente em doenças neurodegenerativas.
Bibliografía
- Xue, C., Kowshik, S.S., Lteif, D. et al. “Diagnóstico diferencial de etiologías de demencia basado en IA sobre datos multimodales”. Nat Med (2024). https://doi.org/10.1038/s41591-024-03118-z