Le scoperte delle neuroscienze, che vanno dalla natura della memoria ai trattamenti per le malattie, sono dipese dalla lettura della mente dei topi, quindi i ricercatori devono capire veramente cosa dice loro il comportamento dei roditori durante gli esperimenti. In un nuovo studio che esamina l’apprendimento attraverso la ricompensa, i ricercatori del MIT hanno decifrato alcuni comportamenti inizialmente mistificanti dei topi, producendo nuove idee su come pensano i topi e uno strumento matematico per aiutare la ricerca futura.
Il compito che i topi avrebbero dovuto eseguire è semplice: girare una ruota a sinistra o a destra per ottenere una ricompensa e poi riconoscere quando la direzione della ricompensa cambia. Quando le persone neurotipiche giocano a questi giochi di “apprendimento inverso”, deducono rapidamente l’approccio ottimale: restare nella direzione che funziona finché non funziona più e poi cambiare immediatamente. In particolare, le persone affette da schizofrenia hanno difficoltà con questo compito. Nel nuovo studio in Biologia computazionale PLOSi topi hanno sorpreso gli scienziati dimostrando che, sebbene fossero in grado di apprendere la strategia “win-stay, loss-shift”, si rifiutavano comunque di adottarla completamente.
“Non è che i topi non possano formare un modello basato sull’inferenza di questo ambiente: possono farlo”, ha detto l’autore corrispondente Mriganka Sur, professore di Newton presso il Picower Institute for Learning and Memory e il Dipartimento di cervello e scienze cognitive (BCS) del MIT. “La cosa sorprendente è che non persistono. Anche in un singolo blocco del gioco in cui sai che la ricompensa è al 100% da un lato, ogni tanto provano dall’altro lato.”
Mentre il motivo del mouse di allontanarsi dalla strategia ottimale potrebbe essere dovuto all’incapacità di mantenerla in memoria, ha detto l’autore principale e studente laureato del Sur Lab, Nhat Le, un’altra possibilità è che i topi non si impegnino nel “vinci-stai, perdi”. -shift” perché non hanno fiducia che le loro circostanze rimarranno stabili o prevedibili. Potrebbero invece deviare dal regime ottimale per verificare se le regole sono cambiate. Dopotutto, gli ambienti naturali raramente sono stabili o prevedibili.
“Mi piace pensare che i topi siano più intelligenti di quanto pensiamo”, ha detto Le.
Ma indipendentemente dal motivo che può indurre i topi a mescolare le strategie, ha aggiunto il co-autore senior Mehrdad Jazayeri, professore associato in BCS e McGovern Institute for Brain Research, è importante che i ricercatori riconoscano che lo fanno e siano in grado di dire quando e come scelgono una strategia o l’altra.
“Questo studio evidenzia il fatto che, a differenza della saggezza comunemente accettata, i topi che svolgono attività di laboratorio non adottano necessariamente una strategia stazionaria e offre un approccio computazionalmente rigoroso per rilevare e quantificare tali non-stazionarietà”, ha affermato. “Questa capacità è importante perché quando i ricercatori registrano l’attività neurale, la loro interpretazione degli algoritmi e dei meccanismi sottostanti potrebbe non essere valida se non tengono conto delle strategie di spostamento degli animali.”
Monitoraggio del pensiero
Il gruppo di ricerca, che comprende anche il coautore Murat Yildirim, ex postdoc del laboratorio Sur e ora assistente professore presso il Lerner Research Institute della Cleveland Clinic, inizialmente si aspettava che i topi potessero adottare una strategia o l’altra. Hanno simulato i risultati che si aspettavano di vedere se i topi adottassero la strategia ottimale di dedurre una regola sul compito, o esaminando in modo più casuale se le svolte a sinistra o a destra venivano premiate. Il comportamento dei topi durante l’attività, anche a distanza di giorni, variava ampiamente ma non assomigliava mai ai risultati simulati con una sola strategia.
In misura diversa e individuale, le prestazioni dei topi nell’attività riflettevano la varianza lungo tre parametri: quanto velocemente cambiavano direzione dopo il cambio della regola, quanto tempo impiegavano per passare alla nuova direzione e quanto rimanevano fedeli alla nuova direzione. Su 21 topi, i dati grezzi rappresentavano una sorprendente diversità di risultati su un compito che gli esseri umani neurotipici ottimizzano in modo uniforme. Ma i topi chiaramente non erano indifesi. La loro prestazione media è migliorata significativamente nel tempo, anche se è rimasta al di sotto del livello ottimale.
Nel compito, il lato premiato cambiava ogni 15-25 turni. Il team si è reso conto che i topi utilizzavano più di una strategia in ciascuno di questi “blocchi” del gioco, invece di limitarsi a dedurre la semplice regola e ottimizzare in base a tale inferenza. Per capire quando i topi utilizzavano quella strategia o un’altra, il team ha sfruttato un quadro analitico chiamato Hidden Markov Model (HMM), che può individuare computazionalmente quando uno stato invisibile sta producendo un risultato rispetto a un altro stato invisibile. Le lo paragona a ciò che potrebbe fare un giudice in uno spettacolo di cucina: dedurre quale chef concorrente ha preparato quale versione di un piatto in base ai modelli di ogni piatto di cibo prima di loro.
Prima di poter utilizzare un HMM per decifrare i risultati delle prestazioni del mouse, tuttavia, il team ha dovuto adattarlo. Un tipico HMM potrebbe applicarsi alle scelte individuali del mouse, ma in questo caso il team lo ha modificato per spiegare le transizioni delle scelte nel corso di interi blocchi. Hanno soprannominato il loro modello modificato blockHMM. Le simulazioni computazionali dell’esecuzione delle attività utilizzando il blockHMM hanno dimostrato che l’algoritmo è in grado di dedurre i veri stati nascosti di un agente artificiale. Gli autori hanno poi utilizzato questa tecnica per mostrare che i topi mescolavano costantemente più strategie, ottenendo vari livelli di prestazione.
“Abbiamo verificato che ogni animale esegue una miscela di comportamenti provenienti da più regimi invece che un comportamento in un singolo dominio”, hanno scritto Le e i suoi coautori. “In effetti, 17/21 topi utilizzavano una combinazione di modalità di comportamento a prestazioni basse, medie e alte.”
Ulteriori analisi hanno rivelato che le strategie in atto erano effettivamente la strategia di inferenza delle regole “corretta” e una strategia più esplorativa coerente con le opzioni di test casuali per ottenere feedback turno dopo turno.
Ora che i ricercatori hanno decodificato il peculiare approccio adottato dai topi per invertire l’apprendimento, stanno pianificando di osservare più in profondità il cervello per capire quali regioni e circuiti cerebrali sono coinvolti. Osservando l’attività delle cellule cerebrali durante il compito, sperano di discernere ciò che sta alla base delle decisioni che i topi prendono per cambiare strategia.
Esaminando in dettaglio i circuiti di apprendimento inverso, ha detto Sur, è possibile che il team ottenga informazioni che potrebbero aiutare a spiegare perché le persone affette da schizofrenia mostrano prestazioni ridotte nei compiti di apprendimento inverso. Sur ha aggiunto che alcune persone con disturbi dello spettro autistico persistono anche con nuovi comportamenti non ricompensati più a lungo rispetto alle persone neurotipiche, quindi il suo laboratorio terrà presente anche questo fenomeno mentre indagano.
Anche Yildirim è interessato ad esaminare potenziali connessioni cliniche.
“Questo paradigma dell’apprendimento inverso mi affascina poiché voglio usarlo nel mio laboratorio con vari modelli preclinici di disturbi neurologici”, ha detto. “Il prossimo passo per noi è determinare i meccanismi cerebrali alla base di queste differenze nelle strategie comportamentali e se possiamo manipolare queste strategie”.
I finanziamenti per lo studio sono arrivati dal National Institutes of Health, dall’Army Research Office, dal Paul and Lilah Newton Brain Science Research Award, dalla Massachusetts Life Sciences Initiative, dal Picower Institute for Learning and Memory e dalla JPB Foundation.
Da un’altra testata giornalistica. news de www.sciencedaily.com