O que é o modelo de aprendizado profundo para detecção precoce?

Um modelo hierárquico de atenção baseado em aprendizado profundo que analisa notas clínicas de prontuários eletrônicos para prever comprometimento cognitivo nas fases iniciais, interpretando predições por meio de camadas de atenção.

Como as notas clínicas foram processadas para o modelo?

Notas foram divididas por processamento de linguagem natural, seções anotadas por três especialistas usando palavras-chave, com conflitos resolvidos por discussão, e criação de conjuntos rotulados para treinar e testar os algoritmos.

Quais dados foram usados no estudo?

Dados de uma empresa de saúde privada com pacientes acima de 50 anos; notas dos quatro anos anteriores ao diagnóstico foram analisadas, gerando um conjunto com 4.950 seções com palavras-chave e outro com 2.000 seções aleatórias.

Quais métricas avaliaram desempenho do modelo?

Foram usadas AUROC e AUPRC; AUROC avalia sensibilidade versus especificidade, enquanto AUPRC oferece informação complementar e é mais informativa em amostras desbalanceadas com baixa prevalência de casos positivos.

Como o modelo se saiu em comparação com XGBoost e outros modelos?

O modelo de aprendizagem profunda foi o melhor preditor (AUROC 0.971/0.997 e AUPRC 0.933/0.929 nos dois conjuntos), embora XGBoost também tenha apresentado desempenho elevado, sendo alternativa mais simples quando necessário.

Como a NeuronUP poderia contribuir em estudos com notas clínicas?

A NeuronUP pode apoiar no processamento de grandes volumes de notas, definição de palavras-chave, desenho e comparação de modelos, além de agregar experiência clínica e em análise de dados para validação e implementação.

Detecção precoce da deterioração cognitiva a partir de um modelo de aprendizado profundo

Antonio Javier Sutil Jiménez fala neste artigo sobre os dados apresentados no estudo “Modelo de aprendizado profundo para a detecção precoce do comprometimento cognitivo a partir de notas clínicas em prontuários eletrônicos”.

Por que este estudo de modelo de aprendizado a partir de notas clínicas é importante?

Este estudo aborda a detecção precoce do comprometimento cognitivo em adultos, o que é fundamental para realizar intervenções terapêuticas bem-sucedidas, retardar o declínio, prevenir o desenvolvimento de doenças ou facilitar a inscrição de participantes em ensaios clínicos.

Doença de Alzheimer

A doença de Alzheimer é um tipo de demência que representa um grande problema em nível mundial. Essa doença foi diagnosticada em quase 6 milhões de pessoas nos Estados Unidos, e sua prevalência aumenta com a idade, por isso espera-se que o envelhecimento da população também aumente sua incidência ao longo dos próximos anos.

No entanto, para além da doença de Alzheimer, o comprometimento cognitivo leve é um problema de grande relevância, que em muitos casos está associado ao posterior desenvolvimento de demência.

Comprometimento cognitivo subjetivo

Da mesma forma, recentemente foi criada a categoria de comprometimento cognitivo subjetivo. Esse termo refere-se à percepção do indivíduo de estar experimentando um declínio de suas capacidades cognitivas em comparação com seu estado anterior.

Embora esse rótulo não seja uma doença em si, foi identificado que pessoas com essa condição podem estar em um estágio inicial de comprometimento cognitivo.

Detecção do comprometimento cognitivo

Apesar dos grandes esforços para melhorar os tratamentos para esses pacientes, a detecção do comprometimento cognitivo continua a ser um desafio, e a melhoria das ferramentas de detecção é necessária para que os tratamentos posteriores sejam eficazes.

Ferramentas na atenção primária

Visto que o número de profissionais especializados para atender a população em risco é limitado, uma possível solução poderia ser fornecer ferramentas aos médicos de atenção primária. Esses médicos não são especialistas em demência, mas têm contato direto com essa população, por isso prover-lhes ferramentas para o diagnóstico surge como uma solução viável.

Registros médicos electrónicos

O uso dos registros médicos eletrônicos é proposto como uma alternativa adequada para a elaboração dessas ferramentas, já que esses compõem o histórico de visitas dos pacientes dentro de um sistema de atenção médica.

No entanto, é importante destacar a dificuldade de identificar os sinais de comprometimento cognitivo não associados à idade, que muitas vezes ficam documentados em avaliações cognitivas e nas preocupações dos pacientes registradas pelos profissionais de saúde. Embora tenham sido realizados estudos com a informação clínica dos pacientes, poucas vezes se aprofundou o uso das notas clínicas dos registros médicos para esse fim.

Notas clínicas como recurso informativo

Neste estudo propõe-se o uso das notas clínicas como um recurso informativo que poderia capturar informações não consideradas na maioria dos estudos. Analisar as notas clínicas manualmente seria muito custoso, por isso o objetivo do estudo foi desenvolver um modelo de detecção automático baseado em aprendizado profundo.

Portanto, a abordagem deste estudo é original e inovadora ao utilizar as notas clínicas.

As notas clínicas são muito importantes para os históricos de saúde no âmbito clínico. No entanto, seu uso no âmbito científico tem sido limitado, tornando sua aplicação para a detecção precoce do comprometimento cognitivo potencialmente de grande interesse.

O que foi feito?

Base de datos

Para a realização deste estudo, foram coletados dados de uma empresa de saúde privada, filtrando os pacientes por idade (deviam ter mais de 50 anos) e pelo diagnóstico de comprometimento cognitivo leve. Em concreto, foram analisadas as notas clínicas dos 4 anos anteriores ao diagnóstico.

A definição do comprometimento cognitivo baseou-se na menção de sintomas, diagnóstico, avaliações cognitivas e tratamentos. Quando as notas indicavam progresso, episódios transitórios ou reversíveis, foram consideradas negativas para comprometimento cognitivo.

Processamento das notas clínicas e desenvolvimento da base de dados

Inicialmente, devido ao comprimento das notas clínicas, foi utilizado um processador de linguagem natural para dividi-las em seções. Essa divisão permitiu identificar se cada seção indicava comprometimento cognitivo ou não.

Em seguida, foram identificadas palavras-chave selecionadas por especialistas, treinados para identificar seções que continham indícios de comprometimento cognitivo. Três anotadores rotularam as seções, e os conflitos foram resolvidos mediante discussões com especialistas na matéria, alcançando um bom nível de concordância entre os anotadores.

Além disso, foi criado um conjunto de dados rotulado com 4.950 seções para treinar e testar vários algoritmos de aprendizado de máquina. Finalmente, foram criadas duas bases de dados que seriam utilizadas para o desenvolvimento e validação do modelo.

Conjuntos de dados

O primeiro conjunto de dados, utilizado para o desenvolvimento do modelo, incluía apenas seções com palavras-chave selecionadas. Esse conjunto continha 4.950 seções anotadas, prontas para o desenvolvimento dos modelos de aprendizado de máquina.

O segundo conjunto de dados consistiu em 2.000 seções selecionadas aleatoriamente de todas as notas, excluindo as usadas no primeiro conjunto. Esse segundo conjunto foi utilizado para verificar a capacidade de generalização do modelo em seções de notas sem aplicar um filtro baseado em palavras-chave.

Desenvolvimento do modelo e validação

Para desenvolver o modelo, utilizaram uma estrutura hierárquica de atenção baseada em aprendizado profundo que havia sido desenvolvida em um trabalho prévio, além de quatro algoritmos base de aprendizado de máquina: regresión logística, random forest, support vector machine e XGBoost.

O modelo previamente desenvolvido incorporava uma rede neural convolucional adaptada ao contexto, o que permitia lidar com variações de palavras e interpretar a predição por meio de camadas de atenção. Para obter mais informações sobre o modelo, recomenda-se consultar o artigo em questão e suas tabelas suplementares.

Interpretação da predição do modelo

Para interpretar a predição do modelo, foram identificadas as palavras com maior peso nas camadas de atenção utilizadas na predição. As palavras com um peso relevante, isto é, de pelo menos 2 desvios padrão acima da média, foram consideradas de alta atenção e comparadas com as palavras-chave originais selecionadas.

Por outro lado, para os modelos base, as seções foram representadas pela frequência de ocorrência de termos, e os algoritmos foram treinados e testados por meio de validação cruzada. Posteriormente, os resultados do modelo desenvolvido pelo grupo de pesquisa foram comparados com os 4 modelos base mencionados.

Comparação de métricas

As duas medidas usadas para a comparação das métricas foram AUROC (área sob a curva da característica operativa do receptor) e AUPRC (área sob a curva de precisão e recuperação).

AUROC é um método de análise habitual nesses modelos, pois permite avaliar os diferentes limiares entre sensibilidade e especificidade. AUPRC é outra métrica importante que oferece informação complementar para dados não balanceados, quando a porcentagem de casos positivos é baixa.

Inscreva-se
na nossa
Newsletter

Quais são as principais conclusões deste estudo de modelo de aprendizado a partir de notas clínicas?

A conclusão principal deste estudo é que é possível realizar previsões diagnósticas de comprometimento cognitivo utilizando um modelo baseado nas notas clínicas. Esses pacientes podem estar nas primeiras fases do comprometimento cognitivo, o que permitiria identificar sinais precoces nos registros eletrônicos de saúde.

O modelo desenvolvido para esse propósito foi o melhor preditor para detectar pacientes que desenvolverão comprometimento cognitivo, sem depender dos dados estruturados. Embora o modelo de aprendizado profundo tenha sido o melhor, o modelo XGBoost também mostrou boas predições, e se coloca como uma alternativa mais simples caso não se disponha da tecnologia necessária.

Métricas AUROC e AUPRC

Para comprovar esses resultados, podem-se observar as pontuações obtidas nas métricas AUROC e AUPRC nos conjuntos de dados 1 e 2 (ver tabelas 1 e 2, respectivamente). É especialmente notável que o modelo baseado em aprendizagem profunda é o melhor preditor em ambas as métricas.

No caso do AUROC, todos os valores são superiores a 0.9, sendo sempre o modelo de aprendizagem profunda o que melhor prediz. Quanto ao AUPRC, isso é ainda mais evidente, pois esse modelo é o único que se mantém acima do valor 0.9.

As diferenças entre essas métricas reforçam a consistência dos resultados, uma vez que, enquanto o AUROC mostra a relação entre a taxa de verdadeiros positivos e falsos positivos, o AUPRC reflete a relação entre precisão e sensibilidade.

Em amostras desbalanceadas, a métrica AUROC pode ser menos conservadora com os falsos positivos, por isso a informação complementar do AUPRC permite confirmar o bom desempenho deste modelo.

Modelo	AUROC	AUPRC
Regressão logística	0.936	0.880
Random Forest	0.950	0.889
Máquina de Vetores de Suporte	0.939	0.883
XGBoost	0.953	0.882
Aprendizagem profunda	0.971	0.933

Tabela 1. Comparação dos modelos para o conjunto de dados com 4950 seções.

Modelo	AUROC	AUPRC
Regressão logística	0.969	0.762
Random Forest	0.985	0.830
Máquina de Vetores de Suporte	0.954	0.723
XGBoost	0.988	0.898
Aprendizagem profunda	0.997	0.929

Tabela 2. Comparação dos modelos para o conjunto de dados com 2000 seções.

Desempenho do modelo

Outro ponto que destaca este estudo é que o comprimento das notas pode afetar o desempenho do modelo; no entanto, mantendo conteúdo suficiente, demonstra-se que a classificação por seções pode ser factível.

Além disso, esse tipo de modelo poderia ser aplicado a outras patologias, embora seja importante considerar que a identificação de informação ambígua ou complexa pode ser difícil.

Onde a NeuronUP poderia contribuir em um estudo como este?

NeuronUP poderia contribuir de diversas formas a um estudo como este, pois tem uma ampla trajetória trabalhando com grandes quantidades de dados.

Como se observa neste estudo, o manejo de grandes volumes de dados é um dos principais desafios ao trabalhar com notas clínicas. Portanto, a equipe da NeuronUP, que conta com especialistas tanto no âmbito clínico quanto na análise de dados, poderia realizar valiosas contribuições no processamento da informação, seja por meio do uso de palavras-chave ou sem elas.

Por outro lado, este estudo destaca-se pela comparação de cinco modelos diferentes, o que confere robustez aos resultados obtidos para seu modelo. A experiência da equipe da NeuronUP também poderia ser útil no desenho de um modelo específico para esse propósito, ou na criação de modelos robustos para compará-los com o modelo desenvolvido.

Li Zhou. Professora de medicina na Faculdade de Medicina de Harvard há mais de dez anos, e é a investigadora principal no Brigham and Women’s Hospital. Possui doutorado em Informática Biomédica pela Universidade de Columbia, e sua pesquisa tem se centrado no processamento de linguagem natural, na gestão do conhecimento e no apoio à tomada de decisões clínicas. Além disso, foi investigadora principal em numerosos projetos de pesquisa financiados pela AHRQ, NIH e CRICO/RMF.

Bibliografia

Wang L, Laurentiev J, Yang J, et al. Development and Validation of a Deep Learning Model for Earlier Detection of Cognitive Decline From Clinical Notes in Electronic Health Records. JAMA Netw Open. 2021;4(11):e2135174. doi:10.1001/jamanetworkopen.2021.35174