Il primo caso documentato di tumore del pancreas risale al XVIII secolo. Da allora, i ricercatori hanno intrapreso un’odissea lunga e impegnativa per comprendere questa malattia sfuggente e mortale. Ad oggi, non esiste un trattamento contro il cancro migliore dell’intervento precoce. Sfortunatamente, il pancreas, annidato in profondità nell’addome, è particolarmente sfuggente per la diagnosi precoce.
Gli scienziati del MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), insieme a Limor Appelbaum, uno scienziato del Dipartimento di Radioterapia Oncologica del Beth Israel Deaconess Medical Center (BIDMC), erano ansiosi di identificare meglio i potenziali pazienti ad alto rischio. Hanno deciso di sviluppare due modelli di apprendimento automatico per la diagnosi precoce dell’adenocarcinoma duttale pancreatico (PDAC), la forma più comune di cancro.
Per accedere a un database ampio e diversificato, il team si è sincronizzato con una società di rete federata, utilizzando i dati delle cartelle cliniche elettroniche di varie istituzioni negli Stati Uniti. Questo vasto pool di dati ha contribuito a garantire l’affidabilità e la generalizzabilità dei modelli, rendendoli applicabili a un’ampia gamma di popolazioni, posizioni geografiche e gruppi demografici.
I due modelli — la rete neurale “PRISM” e il modello di regressione logistica (una tecnica statistica per la probabilità) hanno sovraperformato i metodi attuali. Il confronto del team ha mostrato che mentre i criteri di screening standard identificano circa il 10% dei casi di PDAC utilizzando una soglia di rischio relativo cinque volte più alta, Prism è in grado di rilevare il 35% dei casi di PDAC a questa stessa soglia.
L’uso dell’intelligenza artificiale per rilevare il rischio di cancro non è un fenomeno nuovo — Gli algoritmi analizzano mammografie, scansioni TC per il cancro ai polmoni e assistono nell’analisi dei test Pap test e del test HPV, per citare alcune applicazioni. “I modelli PRISM si distinguono per il loro sviluppo e validazione su un ampio database di oltre 5 milioni di pazienti, superando la portata della maggior parte delle ricerche precedenti nel campo”, afferma Kai Jia, uno studente di dottorato in ingegneria elettrica e informatica (EECS) del MIT. , affiliato del MIT CSAIL e primo autore ad accesso aperto carta dentro eBioMedicina delineando il nuovo lavoro.
“Il modello utilizza dati clinici e di laboratorio di routine per fare le sue previsioni, e la diversità della popolazione statunitense rappresenta un progresso significativo rispetto ad altri modelli PDAC, che di solito sono limitati a regioni geografiche specifiche, come alcuni centri sanitari negli Stati Uniti. Inoltre , l’utilizzo di una tecnica di regolarizzazione unica nel processo di formazione ha migliorato la generalizzabilità e l’interpretabilità dei modelli”.
“Questo rapporto delinea un potente approccio per utilizzare i big data e gli algoritmi di intelligenza artificiale per perfezionare il nostro approccio all’identificazione dei profili di rischio per il cancro”, afferma David Avigan, professore della Harvard Medical School e direttore del centro oncologico e capo del dipartimento di ematologia e neoplasie ematologiche presso il BIDMC. , che non è stato coinvolto nello studio. “Questo approccio può portare a nuove strategie per identificare i pazienti ad alto rischio di tumore maligno che potrebbero trarre beneficio da uno screening mirato con il potenziale di un intervento precoce”.
Prospettive prismatiche
Il viaggio verso lo sviluppo di PRISM è iniziato più di sei anni fa, alimentato da esperienze dirette con i limiti delle attuali pratiche diagnostiche. “Circa l’80-85% dei pazienti affetti da cancro al pancreas viene diagnosticato in stadi avanzati, dove la cura non è più un’opzione”, afferma l’autore senior Appelbaum, che è anche istruttore della Harvard Medical School e oncologo radioterapista. “Questa frustrazione clinica ha dato origine all’idea di approfondire la ricchezza di dati disponibili nelle cartelle cliniche elettroniche (EHR).”
La stretta collaborazione del gruppo CSAIL con Appelbaum ha permesso di comprendere meglio gli aspetti medici e di apprendimento automatico del problema, portando infine a un modello molto più accurato e trasparente. “L’ipotesi era che queste registrazioni contenessero indizi nascosti: segni e sintomi sottili che potrebbero fungere da segnali premonitori di cancro al pancreas”, aggiunge. “Ciò ha guidato il nostro utilizzo delle reti federate di cartelle cliniche elettroniche nello sviluppo di questi modelli, per un approccio scalabile per l’implementazione di strumenti di previsione del rischio nell’assistenza sanitaria”.
Entrambi i modelli PrismNN e PrismLR analizzano i dati EHR, inclusi dati demografici dei pazienti, diagnosi, farmaci e risultati di laboratorio, per valutare il rischio di PDAC. PrismNN utilizza reti neurali artificiali per rilevare modelli complessi nelle caratteristiche dei dati come età, anamnesi e risultati di laboratorio, ottenendo un punteggio di rischio per la probabilità del PDAC. PrismLR utilizza la regressione logistica per un’analisi più semplice, generando un punteggio di probabilità del PDAC basato su queste caratteristiche. Insieme, i modelli offrono una valutazione approfondita di diversi approcci nella previsione del rischio PDAC dagli stessi dati EHR.
Un punto fondamentale per guadagnare la fiducia dei medici, osserva il team, è una migliore comprensione del funzionamento dei modelli, fenomeno noto nel campo come interpretabilità. Gli scienziati hanno sottolineato che mentre i modelli di regressione logistica sono intrinsecamente più facili da interpretare, i recenti progressi hanno reso le reti neurali profonde un po’ più trasparenti. Ciò ha aiutato il team a perfezionare le migliaia di caratteristiche potenzialmente predittive derivate dalle cartelle cliniche elettroniche di un singolo paziente fino a circa 85 indicatori critici. Questi indicatori, che includono l’età del paziente, la diagnosi di diabete e una maggiore frequenza di visite mediche, vengono rilevati automaticamente dal modello ma corrispondono alla comprensione dei medici dei fattori di rischio associati al cancro del pancreas.
Il percorso da seguire
Nonostante le promesse dei modelli PRISM, come tutte le ricerche, alcune parti sono ancora in fase di elaborazione. Soltanto i dati statunitensi rappresentano l’attuale base dei modelli, che necessitano di test e adattamenti per l’uso globale. Il percorso da seguire, osserva il team, prevede l’espansione dell’applicabilità del modello a set di dati internazionali e l’integrazione di biomarcatori aggiuntivi per una valutazione del rischio più raffinata.
“Un ulteriore obiettivo per noi è quello di facilitare l’implementazione dei modelli nei contesti sanitari di routine. L’obiettivo è far sì che questi modelli funzionino perfettamente sullo sfondo dei sistemi sanitari, analizzando automaticamente i dati dei pazienti e avvisando i medici dei casi ad alto rischio senza aumentare il loro carico di lavoro”, afferma Jia. “Un modello di apprendimento automatico integrato con il sistema EHR potrebbe fornire ai medici avvisi tempestivi per i pazienti ad alto rischio, consentendo potenzialmente interventi ben prima che si manifestino i sintomi. Siamo ansiosi di implementare le nostre tecniche nel mondo reale per aiutare tutti gli individui a godere di una vita più lunga e più sana”.
Scritto da Rachele Gordon
Da un’altra testata giornalistica. news de www.technology.org