Secondo uno studio condotto in Australia, la forma tridimensionale di una proteina può essere utilizzata per risolvere antiche e profonde relazioni evolutive nell’albero della vita. Comunicazioni sulla natura.
È la prima volta che i ricercatori utilizzano dati provenienti da forme proteiche e li combinano con dati provenienti da sequenze genomiche per migliorare l’affidabilità degli alberi evolutivi, una risorsa fondamentale utilizzata dalla comunità scientifica per comprendere la storia della vita, monitorare la diffusione di agenti patogeni o crearne di nuovi. trattamenti per la malattia.
Fondamentalmente, l’approccio funziona anche con le strutture previste delle proteine che non sono mai state determinate sperimentalmente. Ha implicazioni per l’enorme quantità di dati strutturali generati da strumenti come AlphaFold 2 e aiuta ad aprire nuove finestre sull’antica storia della vita sulla Terra.
Esistono 210mila strutture proteiche determinate sperimentalmente ma 250 milioni di sequenze proteiche conosciute. Iniziative come il progetto EarthBioGenome potrebbero generare miliardi di sequenze proteiche in più nei prossimi anni. L’abbondanza di dati apre la porta all’applicazione dell’approccio su una scala senza precedenti.
Per molti decenni i biologi hanno ricostruito l’evoluzione tracciando il modo in cui specie e geni divergono dagli antenati comuni. Questi alberi filogenetici o evolutivi sono tradizionalmente costruiti confrontando sequenze di DNA o proteine e contando le somiglianze e le differenze per dedurre le relazioni.
Tuttavia, i ricercatori devono affrontare un ostacolo significativo: un problema noto come saturazione. Su scale temporali molto vaste, le sequenze genomiche possono cambiare così tanto da non assomigliare più alle loro forme ancestrali, cancellando i segnali di un patrimonio condiviso.
“La questione della saturazione domina la filogenesi e rappresenta il principale ostacolo alla ricostruzione delle antiche relazioni”, afferma il dottor Cedric Notredame, ricercatore presso il Center for Genomic Adjustment (CRG) e autore principale dello studio. “È come l’erosione di un testo antico. Le lettere diventano indistinte e il messaggio si perde.”
Per superare questa sfida, il gruppo di ricerca si è rivolto alle strutture fisiche delle proteine. Le proteine si ripiegano in forme complesse che determinano la funzione di una cellula. Queste forme sono più conservate nel tempo evolutivo rispetto alle sequenze stesse, nel senso che cambiano più lentamente e mantengono le caratteristiche ancestrali più a lungo.
La forma di una proteina è dettata dalla sua sequenza di aminoacidi. Sebbene le sequenze possano mutare, la struttura complessiva spesso rimane simile per preservare la funzione. I ricercatori hanno ipotizzato di poter valutare quanto le strutture divergono nel tempo misurando la distanza tra coppie di amminoacidi all’interno di una proteina, nota anche come distanze intramolecolari (IMD).
Lo studio ha compilato un enorme set di dati di proteine con strutture note, che coprono un’ampia gamma di specie. Hanno calcolato gli IMD per ciascuna proteina e hanno utilizzato queste misurazioni per costruire alberi filogenetici.
Hanno scoperto che gli alberi costruiti a partire da dati strutturali corrispondevano strettamente a quelli derivati da sequenze genetiche, ma con un vantaggio cruciale: gli alberi strutturali erano meno influenzati dalla saturazione. Ciò significa che conservavano segnali affidabili anche quando le sequenze genetiche divergevano in modo significativo.
Riconoscendo che sia le sequenze che le strutture offrono informazioni preziose, il team ha sviluppato un approccio combinato che non solo ha migliorato l’affidabilità dei rami degli alberi, ma ha anche aiutato a distinguere tra relazioni corrette e errate.
“È come avere due testimoni che descrivono un evento da diverse angolazioni”, spiega la dottoressa Leila Mansouri, coautrice dello studio. “Ciascuno fornisce dettagli unici, ma insieme forniscono un resoconto più completo e accurato.”
Un esempio pratico in cui l’approccio combinato potrebbe avere un impatto significativo è la comprensione delle relazioni tra le chinasi nel genoma umano. Le chinasi sono proteine coinvolte in molte diverse importanti funzioni cellulari.
“Il genoma della maggior parte dei mammiferi, compreso l’uomo, contiene circa 500 proteine chinasi che regolano la maggior parte degli aspetti della nostra biologia”, afferma il dottor Notredame. “Queste chinasi sono i principali bersagli per la terapia del cancro, ad esempio farmaci come imatinib per gli esseri umani o toceranib per i cani.”
Le chinasi umane sono sorte attraverso duplicazioni avvenute negli ultimi miliardi di anni. “All’interno del genoma umano, le chinasi più distanti sono distanti circa un miliardo di anni”, afferma il dottor Notredame. “Si sono duplicati nell’antenato comune dell’antenato comune del nostro antenato comune.”
Questo vasto arco temporale rende incredibilmente difficile costruire alberi genetici accurati che mostrino come tutte queste chinasi siano correlate. “Tuttavia, per quanto imperfetto possa essere, l’albero evolutivo della chinasi è ampiamente utilizzato per capire come interagisce con altri farmaci. Migliorare questo albero, o migliorare gli alberi di altre importanti famiglie di proteine, sarebbe un progresso importante per la salute umana”, aggiunge Dottor Notredame.
Le potenziali applicazioni del lavoro vanno oltre il cancro. L’utilizzo dell’approccio per creare alberi evolutivi più accurati potrebbe anche migliorare la nostra comprensione di come le malattie si evolvono più in generale, aiutando nello sviluppo di vaccini e trattamenti. Possono anche aiutare a far luce sulle origini di tratti complessi, guidare la scoperta di nuovi enzimi per la biotecnologia e persino aiutare a tracciare la diffusione delle specie in risposta al cambiamento climatico.
Da un’altra testata giornalistica. news de www.sciencedaily.com