In questo articolo, la dottoranda Marta Arbizu Gómez presenta lo studio «I grandi modelli linguistici decostruiscono l’intuizione clinica per diagnosticare l’autismo», in cui si esplora l’impatto dell’uso di modelli linguistici su larga scala per la diagnosi dell’autismo.
Introduzione
La diagnosi del disturbo dello spettro autistico (ASD) è stata tradizionalmente un compito complesso, che dipende in larga misura dall’esperienza clinica, dall’osservazione dettagliata e dall’interpretazione di comportamenti diversi. Sebbene esistano linee guida diagnostiche ben definite come il DSM-5, nella pratica clinica ci si affida spesso a una “intuizione” che i professionisti sviluppano dopo anni di esperienza. Ma cosa accadrebbe se potessimo “leggere” questa intuizione e comprenderla da un approccio più oggettivo?
Uno studio recente pubblicato sulla rivista Cell, intitolato “Large language models deconstruct the clinical intuition behind diagnosing autism”, esplora proprio questa possibilità: utilizzare modelli linguistici su larga scala (LLM, secondo l’acronimo inglese) per decifrare i modelli seguiti dai clinici nella diagnosi dell’autismo. I risultati non solo sono sorprendenti, ma potrebbero anche avere profonde implicazioni su come comprendiamo e realizziamo le diagnosi di ASD oggi.
Il contesto: perché è necessario rivedere il modo in cui diagnostichiamo l’autismo?
L’ASD è un disturbo del neurosviluppo caratterizzato da difficoltà nella comunicazione sociale e da modelli di comportamento e interessi ristretti e ripetitivi. Tuttavia, queste caratteristiche possono presentarsi con grande variabilità tra gli individui, rendendo la diagnosi un processo sfumato e, a volte, soggettivo.
Inoltre, sebbene strumenti diagnostici standardizzati come ADOS o ADI-R apportino struttura al processo, molte diagnosi si basano su rapporti narrativi scritti da clinici che hanno osservato il paziente. In altre parole, il modo in cui il clinico descrive il paziente può avere un grande peso nella diagnosi finale.
Di fronte a questa realtà, i ricercatori si sono posti una domanda chiave: quali elementi all’interno di questi rapporti scritti stanno realmente guidando le decisioni diagnostiche?
Ottenere un programma di stimolazione cognitiva per persone con lesioni cerebrali
Cosa hanno fatto i ricercatori?
Gli autori dello studio hanno raccolto oltre 40.000 rapporti clinici di pazienti pediatrici del sistema sanitario pubblico del Massachusetts. Questi rapporti, redatti da professionisti della salute mentale, contenevano descrizioni dettagliate del comportamento e del funzionamento dei pazienti.
Con questo database, i ricercatori hanno addestrato diversi modelli linguistici, tra cui GPT-4 (sviluppato da OpenAI) e un modello clinico open source chiamato Clinician-LLaMA. L’idea era che i modelli apprendessero a prevedere se un rapporto clinico corrispondeva a un paziente con diagnosi di ASD oppure no, basandosi solo sul testo.
I risultati sono stati sorprendenti: i modelli hanno raggiunto una notevole precisione nella classificazione, anche quando venivano nascoste informazioni chiave come il sesso o l’età del paziente. Ciò suggeriva che i rapporti contenevano schemi linguistici impliciti che i modelli erano in grado di rilevare e che riflettevano il modo in cui i clinici prendono decisioni.
Cosa hanno scoperto?
Oltre alla precisione nella previsione, l’aspetto più interessante è stato ciò che i modelli hanno rivelato sul processo diagnostico stesso. Analizzando quali frammenti di testo avevano maggiore peso nelle decisioni del modello, i ricercatori hanno identificato che certi tipi di comportamenti e descrizioni erano più determinanti di altri.
Come possiamo osservare nel grafico, i comportamenti ripetitivi, stereotipati, gli interessi ristretti e gli aspetti legati alla percezione sensoriale sono stati i fattori più associati a una diagnosi positiva di ASD. Al contrario, le difficoltà nell’interazione sociale, che sono uno dei pilastri tradizionali della diagnosi secondo il DSM-5, si sono rivelate avere un peso minore nei modelli.
Ciò non significa che le difficoltà sociali non siano rilevanti, ma che, nella pratica, i clinici sembrano prestare più attenzione — forse in modo inconscio — ad altri modelli comportamentali al momento di decidere se un paziente soddisfa i criteri diagnostici.
Di seguito, vengono riassunti i principali risultati dello studio in una tabella per facilitarne la comprensione:
Aspetto analizzato | Risultato / Osservazione |
Modello utilizzato | GPT-4 e Clinician-LLaMA (modelli linguistici addestrati con rapporti clinici). |
Fonte dei dati | Oltre 40.000 rapporti clinici pediatrici del sistema sanitario pubblico del Massachusetts. |
Compito del modello | Prevedere se il paziente avesse una diagnosi di autismo basandosi solo sul testo del rapporto. |
Precisione del modello | Alta, anche quando venivano nascoste variabili come sesso o età. |
Fattori più determinanti nella diagnosi | Comportamenti ripetitivi, interessi ristretti e caratteristiche sensoriali/percettive. |
Fattori meno determinanti | Difficoltà nell’interazione sociale. |
Implicazione chiave | Nella pratica clinica, i comportamenti osservabili influenzano più del previsto. |
Possibile impatto sui criteri diagnostici | Suggerisce la necessità di rivalutare il peso di certi criteri nel DSM-5. |
Applicazione dell’IA nella salute mentale | Come strumento di supporto diagnostico e analisi del ragionamento clinico. |
Come si può osservare, i modelli linguistici non solo sono riusciti a prevedere la diagnosi di ASD con alta precisione, ma hanno anche rivelato che certi schemi comportamentali — in particolare i comportamenti ripetitivi e gli interessi ristretti — sono più influenti nella pratica clinica di quanto suggeriscano i criteri diagnostici tradizionali. Questo apre la porta a una riflessione su come questi criteri vengano applicati nel contesto reale.
Implicazioni: dobbiamo ripensare i criteri diagnostici dell’autismo?
Questi risultati aprono un’importante discussione: i criteri diagnostici attuali riflettono realmente il modo in cui i professionisti valutano i pazienti?
Se i clinici, in modo sistematico, danno più importanza ai comportamenti osservabili come le stereotipie o gli interessi ristretti, potrebbe essere necessario rivalutare il peso attribuito a ciascuna categoria diagnostica nelle linee guida ufficiali.
Inoltre, questo approccio potrebbe avere implicazioni per la formazione di nuovi professionisti, i quali potrebbero beneficiare della comprensione di come i criteri vengano applicati nella pratica reale, al di là della teoria.
L’intelligenza artificiale può aiutare nella diagnosi clinica dell’ASD?
Una delle grandi promesse dell’intelligenza artificiale nel campo della salute è la sua capacità di individuare schemi complessi in grandi volumi di dati. In questo caso, i modelli linguistici non agiscono solo come strumenti di classificazione, ma anche come strumenti che ci permettono di rendere visibile l’invisibile: la logica implicita dietro le decisioni cliniche.
Lungi dal sostituire i professionisti, questi modelli possono agire come alleati, offrendo un secondo parere basato su migliaia di casi precedenti, e aiutando a individuare bias o incoerenze nei processi diagnostici.
Dove potrebbe contribuire NeuronUP in studi come questo?
NeuronUP potrebbe contribuire in modo significativo a studi come questo facilitando la replicazione in popolazioni più diverse e non anglofone, grazie alla sua presenza internazionale. La sua piattaforma, con centinaia di attività cognitive, permetterebbe di integrare l’analisi dei rapporti clinici con dati strutturati sulle prestazioni cognitive. Inoltre, questo approccio potrebbe essere applicato ad altre condizioni cliniche come l’ADHD o il decadimento cognitivo lieve, migliorando la diagnosi precoce e la precisione diagnostica.
Prova NeuronUP gratis per 7 giorni
Potrai collaborare con le nostre attività, progettare sedute o fare riabilitazione a distanza.
Conclusione dello studio
Questo studio rappresenta una pietra miliare nell’intersezione tra intelligenza artificiale e salute mentale. Utilizzando modelli linguistici per analizzare rapporti clinici, i ricercatori non solo hanno dimostrato che la diagnosi dell’autismo può essere prevista con notevole precisione, ma hanno anche rivelato come si costruisce l’“intuizione clinica” che guida queste decisioni.
In un futuro prossimo, strumenti come questi potrebbero essere integrati nei sistemi sanitari per offrire supporto diagnostico, migliorare la formazione dei professionisti, e forse persino ridefinire i criteri con cui comprendiamo l’autismo. Ciò che è certo è che l’intelligenza artificiale non sta solo trasformando la tecnologia, ma anche il nostro modo di comprendere la mente umana.
Bibliografia
- Feng S, Sondhi R, Tu X, Buckley J, Sands A, Comiter A, Zhang H, Gao R, Sragovich S, Mello JD, Fedorenko E, Saxe R, Sontheimer EJ, Sapiro G, O’Reilly UM, McCoy TH, Beam AL. Large language models deconstruct the clinical intuition behind diagnosing autism. Cell. 2024 Mar 21. doi: 10.1016/j.cell.2024.03.004.
Lascia un commento