Ingegneria Penn oggi parlato con Michele Posa Di robotica nell’era dell’intelligenza artificialeil genio ambulante dei più piccoli, la navigazione nel non familiare e l’eleganza di non imparare tutto.
Posa è un Assistente Professore nel Dipartimento di Ingegneria Meccanica e Meccanica Applicata e il destinatario di un rinnovo della sovvenzione nell’aprile 2023 dal Istituto di ricerca Toyota (TRI).
Il suo lavoro con TRI districa le complessità della locomozione con le gambe – affinando la capacità ancora limitata dei robot di camminare e correre – e semplifica la manipolazione, producendo simulazioni che semplificano il modo in cui i robot afferrano contesti e oggetti sconosciuti.
Iniziamo con le basi. Perché convincere un robot a camminare o tenere le cose è così difficile?
In questo momento, i robot sono gravati da una discrepanza tra le complesse istruzioni computerizzate che diamo loro e il livello di semplicità richiesto per essere efficaci. Gli esseri umani hanno un’intuizione per toccare il mondo che non si adatta al tipo di algoritmi progettati per convincere i robot a fare lo stesso.
Se dovessi osservare la fisica di un problema – diciamo, l’abile manipolazione di un oggetto – e stavi cercando di simularlo sul tuo computer, avresti delle complicate geometrie dell’oggetto, alcune complicate geometrie della mano e del interazione tra queste due geometrie.
È qui che verrebbe eseguita la maggior parte del calcolo e sarebbe inesatto, ad alta intensità energetica e dispendioso in termini di tempo.
Ma, se pensi a come un essere umano potrebbe raccogliere e manipolare un oggetto, quel livello di complessità sembra non necessario. Se prendo una tazza, sto usando movimenti molto complicati, sì, ma non sto ragionando su ogni possibile punto in cui posso mettere le dita.
Se gli esseri umani dovessero calcolare ogni livello di complessità a nostra disposizione, non saremmo anche noi troppo sovraccarichi per funzionare?
Abbastanza! Hai circa 20 diversi assi di movimento nella tua mano. Ma se ti chiedo di tenere qualcosa, ci sono più tipi di tre movimenti indipendenti che userai.
La mano umana è complessa, ma in pratica non usa spesso tutta la sua complessità. Gli esseri umani hanno trovato un modo per semplificare il problema della pianificazione, del controllo e della manipolazione per il quale non abbiamo trovato il giusto equivalente nel calcolo.
Idem per camminare. I più piccoli hanno una comprensione intuitiva di come muoversi e bilanciarsi che supera ciò che la maggior parte dei robot può raggiungere.
Perché è importante avere robot in grado di toccare il mondo come fanno gli umani?
Alcuni compiti sono naturalmente adatti ai robot. Si tratta davvero di un lavoro che non è sicuro o indesiderabile per gli esseri umani. In robotica si parla delle tre D: sporco, pericoloso e noioso.
Questi sono compiti che gli esseri umani svolgono con qualche rischio che i robot potrebbero alleviare, ma è importante anche rendersi conto che i robot possono fare molto di più che occuparsi del lavoro sporco, possono anche fornire e migliorare una funzione sociale.
Ad esempio, potremmo immaginare robot che aiutino le persone a mantenere la propria autonomia a casa man mano che invecchiano. Alcune persone potrebbero preferire il conforto di un aiutante umano. Altri possono preferire l’assistenza di una macchina affidabile in modo da mantenere un senso di indipendenza.
I robot avranno bisogno di qualcos’altro oltre alla capacità di maneggiare oggetti e camminare per svolgere in modo affidabile questi ruoli?
SÌ. Questi robot dovranno anche navigare nell’ignoto e nell’inaspettato nei loro ambienti. In questo momento, ci sono molti robot affidabili nel reparto di produzione. Sono veloci e precisi, ma solo nei loro ambienti preprogrammati.
Una volta che questi robot lasciano quegli ambienti, perdono velocità e precisione. Con TRI stiamo affrontando questo ostacolo creando algoritmi che danno ai robot istruzioni semplificate, riducendo i dati necessari per apprendere e agire.
Abbiamo bisogno di robot in grado non solo di muoversi rapidamente e abilmente, ma anche di negoziare novità e incertezza.
Potrebbe fornire un altro esempio di come potremmo trarre vantaggio da questa futura generazione di robotica efficiente in termini di dati?
Il ripristino di emergenza è importante. Quando si è verificato il disastro di Fukushima nel 2011, è diventato chiaro al mondo, e in particolare alla comunità della robotica, quanto i robot fossero impreparati per la risposta alle emergenze.
Ha ispirato, in parte, il Sfida robotica DARPA, di cui ho fatto parte durante il mio dottorato di ricerca. Quell’anno è diventato un palo nel terreno per la robotica, costringendoci a essere realistici su quanto eravamo avanti e quanto ancora dovevamo andare.
Nel 2011, i robot potevano passare mezz’ora ad aprire una porta e ad attraversare una manciata di gradini e basta.
Quanta strada abbiamo fatto da allora?
Molto lontano. Abbiamo visto piattaforme hardware sempre più capaci. La robotica dell’agilità Cassieche usiamo nel nostro laboratorio, è qualcosa che non esisteva nel 2011.
È successo qualche anno dopo. Abbiamo assistito all’ascesa di un clima di robot commercializzati, che allora non esisteva affatto e che ora sta fiorendo. Con i progressi dell’hardware, del software e l’ascesa dell’apprendimento automatico, i robot sono molto più capaci di quanto non fossero nel 2011.
Tuttavia, se Fukushima si ripetesse oggi, non ci sarebbero ancora robot che potrebbero entrare e fare davvero la differenza al di là del sondaggio o della ricerca. Niente sarà in grado di rimuovere le macerie e girare le valvole, riparare i cavi o premere i pulsanti che devono essere premuti. Ma siamo molto più vicini.
Tutto il tuo lavoro con TRI sembra guidato da un ethos di semplificazione. Puoi dirci cosa sei riuscito a ottenere?
In un certo senso, stiamo ri-semplificando la robotica per l’era dell’apprendimento automatico. Esiste già un modello semplificato di deambulazione attivo da decenni nella robotica: il pendolo invertito. Questo modello ha ridotto al minimo la complessità del camminare e ha portato i robot a una distanza impressionante.
Ma inevitabilmente, se prendi tutta la naturale complessità del camminare e la riduci a un pendolo, hai rivelato un po’ troppo. Hai limitato il tuo robot a fare cose che solo i pendoli possono fare, che non sono molte cose.
La mia ricerca chiede: come possiamo ottenere i vantaggi della semplicità riportando anche alcune delle prestazioni che abbiamo dato via?
Nel lavoro di locomozione con le gambe, abbiamo mantenuto la semplicità del modello del pendolo, ma abbiamo ampliato la serie di compiti (camminare e girare più velocemente, salire pendii più ripidi, per esempio) e ridurre significativamente il consumo di energia.
Nel lavoro di manipolazione stiamo simulando, creando semplicità da zero. Abbiamo mani robotiche che interagiscono con un oggetto, raccolgono dati e poi escogitano un piano che il suo algoritmo costringe a essere il più semplice possibile. Interagisce, armeggia, impara e si corregge finché non lo fa bene. Può farlo in quattro o cinque minuti, il che è un risultato.
Quattro o cinque minuti invece di cosa?
Se non si dispone di alcuna struttura e si utilizza l’apprendimento per rinforzo, possono essere necessarie ore o giorni. È un paragone equo? Una specie di. Applichiamo una struttura minima. Ma le persone scrivono articoli sui robot che imparano a manipolare e navigare in ambienti sconosciuti dove ci vogliono ore o giorni.
È tutto per tentativi ed errori, ma dipende da quanti tentativi ed errori sei disposto ad accettare. Questi altri giornali non sono interessati al sistema fisico, lo trattano come una grande scatola nera. Ma quello che abbiamo dimostrato è che imparare tutto è molto inefficiente dai dati.
Quindi, gli incredibili progressi che stiamo vedendo nell’intelligenza artificiale non si traducono così chiaramente nella robotica come alcune persone sembrano pensare?
Esattamente. A questo punto, le persone hanno utilizzato ChatGPT e hanno visto i robot imparare. E si sono innamorati dell’idea che l’apprendimento automatico risolverà tutti i problemi.
La chiave nel nostro laboratorio è contribuire con la nostra esperienza nel settore – la nostra comprensione della fisica e della dinamica – e combinarla con gli algoritmi perché ci sono sovrapposizioni ed efficienze da sfruttare. Penso che ci sia molto valore nell’apprendimento profondo e nell’automazione.
I robot dovranno imparare cose dal loro ambiente. Non sarà tutto modelli e fisica.
Ma stiamo anche insistendo sul valore delle tecniche a cui le persone hanno pensato per centinaia di anni – fisica, controllo, ottimizzazione – e dimostrando che non seguiranno la fine del dinosauro con l’intelligenza artificiale che prende il sopravvento.
Fonte: Università della Pennsylvania
Da un’altra testata giornalistica. news de www.technology.org