A poco più di un anno dal suo lancio, le capacità di ChatGPT sono ormai note. Il modello di apprendimento automatico può scrivere un saggio decente a livello universitario e sostenere una conversazione in modo quasi umano.
Ma le sue competenze linguistiche potrebbero anche aiutare i primi soccorritori a trovare le persone in difficoltà durante un disastro naturale?
Un nuovo studio condotto dall’Università di Buffalo addestra ChatGPT a riconoscere luoghi, dagli indirizzi di casa agli incroci, nei post sui social media delle vittime del disastro.
Forniti con suggerimenti attentamente costruiti, i modelli GPT “guidati dalla geoconoscenza” dei ricercatori hanno estratto i dati sulla posizione dai tweet inviati durante l’uragano Harvey con un tasso di precisione migliore del 76% rispetto ai modelli GPT predefiniti.
“Questo uso della tecnologia AI potrebbe essere in grado di aiutare i primi soccorritori a raggiungere le vittime più rapidamente e persino a salvare più vite umane”, ha affermato Yingjie Hu, professore associato presso il Dipartimento di Geografia dell’UB, presso il College of Arts and Sciences, e autore principale dello studio. studio, che è stato pubblicato in ottobre nel Giornale internazionale di scienza dell’informazione geografica.
Le vittime dei disastri si sono spesso rivolte ai social media per chiedere aiuto quando i sistemi dei servizi di emergenza sanitaria sono sovraccarichi, anche durante la devastazione dell’area di Houston da parte di Harvey nel 2017.
Tuttavia, i primi soccorritori spesso non hanno le risorse per monitorare i feed dei social media durante un disastro, seguendo i vari hashtag e decidendo quali post sono più urgenti.
La speranza del gruppo di ricerca guidato dall’UB, che comprende anche collaboratori dell’Università della Georgia, dell’Università di Stanford e di Google, che il loro lavoro possa portare a sistemi di intelligenza artificiale in grado di elaborare automaticamente i dati dei social media per i servizi di emergenza.
“ChatGPT e altri grandi modelli linguistici hanno suscitato polemiche per i loro potenziali usi negativi, che si tratti di frode accademica o di eliminazione di posti di lavoro, quindi è entusiasmante sfruttare invece i loro poteri per il bene sociale”, afferma Hu.
“Sebbene esista una serie di preoccupazioni significative e valide sull’emergere di ChatGPT, il nostro lavoro mostra che un lavoro attento e interdisciplinare può produrre applicazioni di questa tecnologia in grado di fornire benefici tangibili alla società”, aggiunge il coautore Kenneth Joseph, assistente professore di il Dipartimento di Informatica e Ingegneria dell’UB, all’interno della Scuola di Ingegneria e Scienze Applicate.
Fondere la “geoconoscenza” in ChatGPT
Immagina un tweet con un messaggio urgente ma chiaro: una famiglia, incluso un novantenne che non è più in grado di reggersi in piedi, ha bisogno di essere soccorsa al 1280 Grant St., Cypress, Texas, 77249.
Un modello tipico, come uno strumento di riconoscimento delle entità nominate (NER), riconoscerebbe l’indirizzo elencato come tre entità separate: Grant Street, Cypress e Texas. Se questi dati venissero utilizzati per la geolocalizzazione, il modello invierebbe i primi soccorritori non a 1280 Grant St., ma nel mezzo di Grant Street, o addirittura nel centro geografico del Texas.
Hu afferma che gli strumenti NER possono essere addestrati a riconoscere descrizioni complete di luoghi, ma ciò richiederebbe un ampio set di dati di descrizioni di luoghi accuratamente etichettati specifici per una determinata area locale, un processo ad alta intensità di manodopera e di tempo.
“Sebbene manchino set di dati etichettati, i primi soccorritori hanno molta conoscenza del modo in cui i luoghi vengono descritti nella loro area locale, che si tratti del nome di un ristorante o di un incrocio popolare”, afferma Hu. “Così ci siamo chiesti: come possiamo integrare in modo rapido ed efficiente questa geoconoscenza in un modello di apprendimento automatico?”
La risposta sono stati i Generative Pretrained Transformers, o GPT, di OpenAI, modelli linguistici di grandi dimensioni già addestrati da miliardi di pagine web e in grado di generare risposte di tipo umano. Attraverso una semplice conversazione e le giuste istruzioni, il team di Hu ha pensato che GPT avrebbe potuto imparare rapidamente a interpretare con precisione i dati sulla posizione dai post sui social media.
Innanzitutto, i ricercatori hanno fornito a GPT 22 tweet reali delle vittime dell’uragano Harvey, che avevano già raccolto ed etichettato in uno studio precedente. Hanno detto a GPT quali parole nel post descrivevano un luogo e che tipo di luogo descriveva, che si trattasse di un indirizzo, una strada, un incrocio, un’attività commerciale o un punto di riferimento.
I ricercatori hanno quindi testato il GPT guidato dalla geoconoscenza su altri 978 tweet dell’uragano Harvey e gli hanno chiesto di estrarre le parole relative alla posizione e di indovinare da solo la categoria di posizione.
I risultati: i modelli GPT guidati dalla geoconoscenza erano migliori del 76% nel riconoscere le descrizioni della posizione rispetto ai modelli GPT non forniti di geoconoscenza, nonché migliori del 40% rispetto agli strumenti NER. I migliori risultati sono stati GPT-3 e GPT-4 guidati dalla geoconoscenza, con ChatGPT guidato dalla geoconoscenza solo leggermente indietro.
“GPT fondamentalmente combina la grande quantità di testo già letto con gli esempi specifici di geoconoscenza che abbiamo fornito per formare le sue risposte”, afferma Hu. “GPT ha la capacità di apprendere rapidamente e adattarsi rapidamente a un problema.”
Tuttavia, il tocco umano, ovvero fornire un buon suggerimento, è fondamentale. Ad esempio, GPT potrebbe non considerare come luogo un tratto di autostrada tra due uscite specifiche, a meno che non venga espressamente richiesto di farlo.
“Ciò sottolinea l’importanza per noi ricercatori di istruire GPT nel modo più accurato e completo possibile in modo che possa fornire i risultati di cui abbiamo bisogno”, afferma Hu.
Lasciare che i primi soccorritori facciano ciò che sanno fare meglio
Il team di Hu ha iniziato il lavoro all’inizio del 2022 con GPT-2 e GPT-3, e successivamente ha incluso GPT-4 e ChatGPT dopo che questi modelli sono stati lanciati rispettivamente alla fine del 2022 e all’inizio del 2023.
“Il nostro metodo sarà probabilmente applicabile ai nuovi modelli GPT che potrebbero uscire negli anni successivi”, afferma Hu.
Dovranno essere fatte ulteriori ricerche per utilizzare le descrizioni delle posizioni estratte da GPT per geolocalizzare effettivamente le vittime e forse trovare modi per filtrare post irrilevanti o falsi su un disastro.
Hu spera che i loro sforzi possano semplificare l’uso delle tecnologie di intelligenza artificiale in modo che i gestori delle emergenze non debbano diventare essi stessi esperti di intelligenza artificiale per utilizzarle e possano concentrarsi sul salvataggio di vite umane.
“Penso che un buon modo per gli esseri umani di collaborare con l’intelligenza artificiale sia lasciare che ciascuno di noi si concentri su ciò in cui è veramente bravo”, afferma Hu. “Lasciamo che i modelli di intelligenza artificiale ci aiutino a completare quei compiti ad alta intensità di lavoro, mentre noi esseri umani ci concentriamo sull’acquisizione di conoscenze e sull’utilizzo di tale conoscenza per guidare i modelli di intelligenza artificiale.”
Il lavoro è stato sostenuto dalla National Science Foundation.
Da un’altra testata giornalistica. news de www.sciencedaily.com