-3.1 C
Rome
sabato, Gennaio 11, 2025
- Pubblicità -
Scienze & AmbienteUtilizzo di LLM per codificare nuove attività per i robot

Utilizzo di LLM per codificare nuove attività per i robot

INFORMATIVA: Alcuni degli articoli che pubblichiamo provengono da fonti non in lingua italiana e vengono tradotti automaticamente per facilitarne la lettura. Se vedete che non corrispondono o non sono scritti bene, potete sempre fare riferimento all'articolo originale, il cui link è solitamente in fondo all'articolo. Grazie per la vostra comprensione.


Probabilmente hai sentito dire che “l’esperienza è il miglior insegnante” – ma cosa succederebbe se l’apprendimento nel mondo reale fosse proibitivamente costoso?

GenSim

Questa è la difficile situazione dei robotisti che si addestrano macchine su compiti di manipolazione. I dati sulle interazioni nel mondo reale sono costosi, quindi i loro robot spesso imparano da versioni simulate di diverse attività.

Tuttavia, queste simulazioni presentano una gamma limitata di compiti perché ogni comportamento è codificato individualmente da esperti umani. Di conseguenza, molti bot non sono in grado di completare le richieste di compiti che non hanno mai visto prima. Ad esempio, un robot potrebbe non essere in grado di costruire una macchinina perché dovrebbe comprendere ogni compito più piccolo all’interno di quella richiesta. Senza dati di simulazione sufficienti e creativi, un robot non può completare ogni fase all’interno di quel processo generale (a volte chiamato attività a lungo orizzonte).

“GenSim” del MIT CSAIL tenta di sovradimensionare i compiti di simulazione su cui queste macchine possono essere addestrate, con una svolta. Dopo che gli utenti hanno richiesto a modelli linguistici di grandi dimensioni (LLM) di generare automaticamente nuove attività o di delineare ogni passaggio all’interno di un comportamento desiderato, l’approccio simula tali istruzioni. Sfruttando il codice all’interno di modelli come GPT4, GenSim fa progressi nell’aiutare i robot a completare ogni attività coinvolta nella produzione, nelle faccende domestiche e nella logistica.

Il sistema versatile dispone di modalità mirate ed esplorative. Nell’impostazione mirata all’obiettivo, GenSim si assume il compito immesso dall’utente e suddivide ogni passaggio necessario per raggiungere tale obiettivo. Nell’impostazione esplorativa, il sistema presenta nuovi compiti. Per entrambe le modalità, il processo inizia con un LLM che genera le descrizioni delle attività e il codice necessario per simulare il comportamento. Quindi, il modello utilizza una libreria di attività per perfezionare il codice. La bozza finale di queste istruzioni può quindi creare simulazioni che insegnano ai robot come svolgere nuovi compiti.

Dopo che gli esseri umani hanno pre-addestrato il sistema su dieci attività, GenSim ha generato automaticamente 100 nuovi comportamenti. Nel frattempo, benchmark comparabili possono raggiungere tale traguardo solo codificando manualmente ciascuna attività. GenSim ha inoltre assistito bracci robotici in diverse dimostrazioni, in cui le sue simulazioni hanno addestrato con successo le macchine a eseguire compiti come il posizionamento di blocchi colorati a una velocità maggiore rispetto ad approcci comparabili.

“All’inizio, abbiamo pensato che sarebbe stato sorprendente trasferire nella robotica il tipo di generalizzazione ed estrapolazione che si trova nei modelli linguistici di grandi dimensioni”, afferma Lirui Wang, dottorando del MIT CSAIL, autore principale dell’articolo. “Quindi abbiamo deciso di distillare quella conoscenza attraverso il mezzo di programmi di simulazione. Quindi, abbiamo avviato la politica del mondo reale basandoci sulle politiche di simulazione addestrate sui compiti generati e le abbiamo condotte attraverso l’adattamento, dimostrando che GenSim funziona sia nella simulazione che nel mondo reale”.

GenSim può potenzialmente aiutare nella robotica da cucina, nella produzione e nella logistica, dove l’approccio potrebbe generare comportamenti per la formazione. A sua volta, ciò consentirebbe alle macchine di adattarsi ad ambienti con processi a più fasi, come l’impilamento e lo spostamento di scatole nelle aree corrette. Per ora il sistema può solo aiutare con attività di raccolta e posizionamento, ma i ricercatori ritengono che GenSim potrebbe eventualmente generare compiti più complessi e abili, come usare un martello, aprire una scatola e posizionare oggetti su uno scaffale. Inoltre, l’approccio è soggetto ad allucinazioni e problemi di base e sono necessari ulteriori test nel mondo reale per valutare l’utilità dei compiti che genera. Ciononostante, GenSim presenta un futuro incoraggiante per gli LLM nell’ideazione di nuove attività robotiche.

“Un problema fondamentale nell’apprendimento dei robot è da dove provengono i compiti e come possono essere specificati”, afferma Jiajun Wu, professore assistente presso l’Università di Stanford, che non è coinvolto nel lavoro. “Il documento GenSim suggerisce una nuova possibilità: sfruttiamo i modelli di base per generare e specificare compiti basati sulla conoscenza del buon senso che hanno appreso. Questo approccio stimolante apre una serie di direzioni di ricerca future verso lo sviluppo di un robot generalista”.

“L’arrivo di grandi modelli linguistici ha ampliato le prospettive di ciò che è possibile nell’apprendimento dei robot e GenSim è un eccellente esempio di una nuova applicazione di LLM che prima non era fattibile”, aggiunge Karol Hausman, ricercatore di Google Deepmind e professore a contratto di Stanford, che inoltre non è coinvolto nel documento. “Dimostra non solo che gli LLM possono essere utilizzati per la generazione di risorse e ambiente, ma anche che possono consentire la generazione di comportamenti robotici su larga scala, un’impresa precedentemente irraggiungibile. Sono molto entusiasta di vedere come la generazione scalabile del comportamento di simulazione avrà un impatto sul campo tradizionalmente affamato di dati dell’apprendimento dei robot e sono molto ottimista riguardo al suo potenziale per affrontare molti dei colli di bottiglia esistenti”.

“La simulazione robotica è stata uno strumento importante per fornire dati e parametri di riferimento per addestrare e valutare i modelli di apprendimento dei robot”, osserva Yuke Zhu, professore assistente presso l’Università del Texas ad Austin, che non è coinvolto in GenSim. “Una sfida pratica per l’utilizzo degli strumenti di simulazione è creare un’ampia raccolta di ambienti realistici con il minimo sforzo umano. Immagino che gli strumenti di intelligenza artificiale generativa, esemplificati da ampi modelli linguistici, possano svolgere un ruolo fondamentale nella creazione di ambienti e attività simulati ricchi e diversificati. In effetti, GenSim mostra la promessa di modelli linguistici di grandi dimensioni nel semplificare la progettazione della simulazione attraverso le loro impressionanti capacità di codifica. Prevedo un grande potenziale per questi metodi nella creazione della prossima generazione di simulazioni robotiche su larga scala”.

Scritto da Alex Shipps

Fonte: Istituto di Tecnologia del Massachussetts



Da un’altra testata giornalistica. news de www.technology.org

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

- Pubblicità -
- Pubblicità -Newspaper WordPress Theme

Contenuti esclusivi

Iscriviti oggi

OTTENERE L'ACCESSO ESCLUSIVO E COMPLETO AI CONTENUTI PREMIUM

SOSTENERE IL GIORNALISMO NON PROFIT

Get unlimited access to our EXCLUSIVE Content and our archive of subscriber stories.

- Pubblicità -Newspaper WordPress Theme

Articoli più recenti

Altri articoli

- Pubblicità -Newspaper WordPress Theme

INFORMATIVA: Alcuni degli articoli che pubblichiamo provengono da fonti non in lingua italiana e vengono tradotti automaticamente per facilitarne la lettura. Se vedete che non corrispondono o non sono scritti bene, potete sempre fare riferimento all'articolo originale, il cui link è solitamente in fondo all'articolo. Grazie per la vostra comprensione.