I ricercatori hanno determinato come costruire modelli affidabili di apprendimento automatico in grado di comprendere equazioni complesse in situazioni del mondo reale utilizzando molti meno dati di addestramento di quanto normalmente previsto.
I ricercatori dell’Università di Cambridge e della Cornell University hanno scoperto che per le equazioni alle derivate parziali – una classe di equazioni fisiche che descrivono come le cose nel mondo naturale si evolvono nello spazio e nel tempo – modelli di apprendimento automatico possono produrre risultati affidabili anche se forniti di dati limitati.
Loro risultatiriportato nel Atti dell’Accademia Nazionale delle Scienzepotrebbe essere utile per costruire modelli di apprendimento automatico più efficienti in termini di tempo e costi per applicazioni di ingegneria e modellazione climatica.
La maggior parte dei modelli di machine learning richiedono dati di training di grandi dimensioni prima di restituire risultati accurati. Tradizionalmente, un essere umano annoterà un grande volume di dati – come ad esempio una serie di immagini – per addestrare il modello.
“Utilizzare gli esseri umani per addestrare modelli di apprendimento automatico è efficace, ma è anche dispendioso in termini di tempo e denaro”, ha affermato il primo autore, il dott. Nicolas Boullé, dell’Isaac Newton Institute for Mathematical Sciences.
“Siamo interessati a sapere esattamente quanti pochi dati abbiamo effettivamente bisogno per addestrare questi modelli e ottenere comunque risultati affidabili.”
Altri ricercatori sono stati in grado di addestrare modelli di apprendimento automatico con una piccola quantità di dati e ottenere risultati eccellenti, ma non è stato ben spiegato come ciò sia stato ottenuto.
Per il loro studio, Boullé e i suoi coautori, Diana Halikias e Alex Townsend della Cornell University, si sono concentrati sulle equazioni alle derivate parziali (PDE).
“Le PDE sono come gli elementi costitutivi della fisica: possono aiutare a spiegare le leggi fisiche della natura, ad esempio il modo in cui si mantiene lo stato stazionario in un blocco di ghiaccio che si scioglie”, ha affermato Boullé, che è un ricercatore post-dottorato della INI-Simons Foundation.
“Dato che sono modelli relativamente semplici, potremmo essere in grado di usarli per fare alcune generalizzazioni sul motivo per cui queste tecniche di intelligenza artificiale hanno avuto così tanto successo in fisica”.
I ricercatori hanno scoperto che le PDE che modellano la diffusione hanno una struttura utile per progettare modelli di intelligenza artificiale. “Utilizzando un modello semplice, potresti essere in grado di applicare parte della fisica che già conosci nel set di dati di addestramento per ottenere precisione e prestazioni migliori”, ha affermato Boullé.
I ricercatori hanno costruito un algoritmo efficiente per prevedere le soluzioni delle PDE in diverse condizioni sfruttando le interazioni a breve e lungo raggio che si verificano.
Ciò ha consentito loro di integrare alcune garanzie matematiche nel modello e di determinare esattamente la quantità di dati di addestramento necessari per ottenere un modello robusto.
“Dipende dal campo, ma per la fisica abbiamo scoperto che in realtà si può fare molto con una quantità di dati molto limitata”, ha affermato Boullé.
“È sorprendente quanti pochi dati siano necessari per ottenere un modello affidabile. Grazie alla matematica di queste equazioni possiamo sfruttare la loro struttura per rendere i modelli più efficienti”.
I ricercatori affermano che le loro tecniche consentiranno ai data scientist di aprire la “scatola nera” di molti modelli di apprendimento automatico e di progettarne di nuovi che possano essere interpretati dagli esseri umani, anche se sono ancora necessarie ricerche future.
“Dobbiamo assicurarci che i modelli imparino le cose giuste, ma l’apprendimento automatico per la fisica è un campo entusiasmante: ci sono molte domande interessanti di matematica e fisica a cui l’intelligenza artificiale può aiutarci a rispondere”, ha affermato Boullé.
Fonte: Università di Cambridge
Da un’altra testata giornalistica. news de www.technology.org