Gli scienziati dell’Oak Ridge National Laboratory hanno utilizzato la loro esperienza in biologia quantistica, intelligenza artificiale e bioingegneria per migliorare il modo in cui CRISPR Cas9 Gli strumenti di modifica del genoma funzionano su organismi come i microbi che possono essere modificati per produrre combustibili e sostanze chimiche rinnovabili.
CRISPR è un potente strumento di bioingegneria, utilizzato per modificare il codice genetico per migliorare le prestazioni di un organismo o per correggere le mutazioni. Lo strumento CRISPR Cas9 si basa su un unico, unico RNA guida che ordina all’enzima Cas9 di legarsi e scindere il corrispondente sito bersaglio nel genoma.
I modelli esistenti per prevedere computazionalmente RNA guida efficaci per gli strumenti CRISPR sono stati costruiti su dati provenienti solo da poche specie modello, con efficienza debole e incoerente quando applicati ai microbi.
“Molti degli strumenti CRISPR sono stati sviluppati per cellule di mammiferi, moscerini della frutta o altre specie modello. Pochi sono stati orientati verso microbi in cui le strutture e le dimensioni cromosomiche sono molto diverse”, ha affermato Carrie Eckert, leader del gruppo di biologia sintetica dell’ORNL.
“Avevamo osservato che i modelli per la progettazione del macchinario CRISPR Cas9 si comportano in modo diverso quando si lavora con i microbi, e questa ricerca convalida ciò che sapevamo aneddoticamente”.
Per migliorare la modellazione e la progettazione dell’RNA guida, gli scienziati dell’ORNL hanno cercato di comprendere meglio ciò che accade al livello più elementare nei nuclei delle cellule, dove è immagazzinato il materiale genetico.
Si sono rivolti alla biologia quantistica, un campo che collega la biologia molecolare e la chimica quantistica e che studia gli effetti che la struttura elettronica può avere sulle proprietà chimiche e sulle interazioni dei nucleotidi, le molecole che formano gli elementi costitutivi del DNA e dell’RNA.
Il modo in cui gli elettroni sono distribuiti nella molecola influenza la reattività e la stabilità conformazionale, inclusa la probabilità che il complesso RNA enzima-guida Cas9 si leghi efficacemente al DNA del microbo, ha affermato Erica Prates, biologa dei sistemi computazionali presso ORNL.
La migliore guida attraverso una foresta di decisioni
Gli scienziati hanno costruito un modello spiegabile di intelligenza artificiale chiamato foresta casuale iterativa. Hanno addestrato il modello su un set di dati di circa 50.000 RNA guida mirati al genoma di Escherichia coli batteri tenendo conto anche delle proprietà chimiche quantistiche, in un approccio descritto nella rivista Ricerca sugli acidi nucleici.
Il modello ha rivelato caratteristiche chiave dei nucleotidi che possono consentire la selezione di RNA guida migliori. “Il modello ci ha aiutato a identificare indizi sui meccanismi molecolari che sono alla base dell’efficienza dei nostri RNA guida”, ha affermato Prates, “dandoci una ricca libreria di informazioni molecolari che possono aiutarci a migliorare la tecnologia CRISPR”.
I ricercatori dell’ORNL hanno convalidato il modello di intelligenza artificiale spiegabile conducendo esperimenti di taglio CRISPR Cas9 Escherichia coli con un folto gruppo di guide selezionate dalla modella.
L’uso dell’intelligenza artificiale spiegabile ha fornito agli scienziati una comprensione dei meccanismi biologici che hanno portato ai risultati, piuttosto che un modello di apprendimento profondo radicato in un algoritmo “scatola nera” privo di interpretabilità, ha affermato Jaclyn Noshay, ex biologa dei sistemi computazionali dell’ORNL e prima autrice dell’articolo. .
“Volevamo migliorare la nostra comprensione delle regole di progettazione delle guide per un’efficienza di taglio ottimale con un focus sulle specie microbiche, data la conoscenza dell’incompatibilità dei modelli addestrati attraverso [biological] regni”, ha detto Noshay.
Il modello di intelligenza artificiale spiegabile, con le sue migliaia di funzionalità e la sua natura iterativa, è stato addestrato utilizzando il supercomputer Summit presso l’Oak Ridge Leadership Computer Facility dell’ORNL, o OLCF, una struttura utente del DOE Office of Science.
Eckert ha affermato che il suo team di biologia sintetica prevede di lavorare con i colleghi di scienze computazionali dell’ORNL per prendere ciò che hanno imparato con il nuovo modello microbico CRISPR Cas9 e migliorarlo ulteriormente utilizzando i dati di esperimenti di laboratorio o una varietà di specie microbiche.
Migliori strumenti CRISPR Cas9 per ogni specie
Prendere in considerazione le proprietà quantistiche apre la porta ai miglioramenti della guida Cas9 per ogni specie. “Questo documento ha implicazioni anche su scala umana”, ha detto Eckert. “Se stai esaminando qualsiasi tipo di sviluppo di farmaci, ad esempio, dove usi CRISPR per colpire una regione specifica del genoma, devi disporre del modello più accurato per prevedere tali guide.”
Il perfezionamento dei modelli CRISPR Cas9 offre agli scienziati una pipeline a maggiore produttività per collegare il genotipo al fenotipo o i geni ai tratti fisici, un campo noto come genomica funzionale. La ricerca ha implicazioni per il lavoro condotto dall’ORNL Centro per l’innovazione bioenergetica (CBI), ad esempio, per migliorare gli impianti di materie prime bioenergetiche e la fermentazione batterica della biomassa.
“Con questa ricerca stiamo migliorando notevolmente le nostre previsioni sull’RNA guida”, ha affermato Eckert. “Meglio comprendiamo i processi biologici in gioco e quanti più dati possiamo inserire nelle nostre previsioni, migliori saranno i nostri obiettivi, migliorando la precisione e la velocità della nostra ricerca”.
“Uno degli obiettivi principali della nostra ricerca è migliorare la capacità di modificare in modo predittivo il DNA di più organismi utilizzando gli strumenti CRISPR. Questo studio rappresenta un entusiasmante progresso verso la comprensione di come possiamo evitare costosi “errori di battitura” nel codice genetico di un organismo”, ha affermato Paul Abraham dell’ORNL, un chimico bioanalitico che guida il DOE Genomic Science Program. Area di interesse per l’ingegneria degli ecosistemi sicuri e la scienza del designo SEED SFA, che ha supportato la ricerca CRISPR.
“Sono ansioso di scoprire quanto queste previsioni possano migliorare man mano che generiamo ulteriori dati di addestramento e continuiamo a sfruttare modelli di intelligenza artificiale spiegabili”.
Tra i coautori della pubblicazione figurano William Alexander, Dawn Klingeman, Erica Prates, Carrie Eckert, Stephan Irle e Daniel Jacobson dell’ORNL; Tyler Walker, Jonathan Romero e Angelica Walker del Centro Bredesen per la ricerca interdisciplinare e l’istruzione universitaria presso l’Università del Tennessee, Knoxville; e Jaclyn Noshay e David Kainer, che in precedenza lavoravano con l’ORNL e ora rispettivamente con Bayer e l’Università del Queensland.
Il finanziamento per il progetto è stato fornito da SEED SFA e CBI, entrambi parte del programma di ricerca scientifica, biologica e ambientale del DOE, dal programma di ricerca e sviluppo diretto dal laboratorio di ORNL e dalle risorse di calcolo ad alte prestazioni di OLCF e Compute e Data Environment for Science, entrambi supportati anche dall’Office of Science.
L’UT-Battelle gestisce l’ORNL per l’Office of Science del DOE, il più grande sostenitore della ricerca di base nelle scienze fisiche negli Stati Uniti. L’Office of Science sta lavorando per affrontare alcune delle sfide più urgenti del nostro tempo. Per maggiori informazioni per favore visita Energy.gov/science.
Da un’altra testata giornalistica. news de www.technology.org