Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
Deep Learning for Holistic Inference

Article Category

Article available in the following languages:

Far progredire la capacità dell’intelligenza artificiale di ricavare il significato da testi e immagini

I nuovi modelli di apprendimento profondo dimostrano la capacità di interpretare in modo olistico gli input di testo, immagini e video.

L’intelligenza umana è una cosa straordinaria. «Osservando semplicemente ciò che ci circonda, possiamo immediatamente trarre conclusioni su ciò che sta accadendo e su chi è coinvolto», afferma Amir Globerson(si apre in una nuova finestra), professore di informatica presso Università di Tel Aviv(si apre in una nuova finestra). «Quando leggiamo un libro, ci formiamo un’immagine mentale del mondo descritto». Sebbene l’intelligenza artificiale (IA) sia impressionante, non è ancora in grado di eguagliare la capacità della mente umana di collegare il significato dei singoli componenti per creare una comprensione coerente dell’insieme. Ma questa competenza è assolutamente fondamentale per l’utilizzo dell’IA, ad esempio, nelle automobili a guida autonoma, nella robotica e nella diagnostica medica. Ecco HOLI(si apre in una nuova finestra), un progetto finanziato dall’UE per aiutare l’intelligenza artificiale ad acquisire una comprensione più olistica degli input di testo e immagine.

Un quadro di riferimento per la progettazione di modelli di apprendimento profondo

Il progetto, che ha ricevuto il sostegno del Consiglio europeo della ricerca(si apre in una nuova finestra), ha fornito un quadro innovativo che può essere utilizzato per progettare modelli di apprendimento profondo in grado di ottenere un’interpretazione completa dei loro input. «Lo abbiamo fatto costruendo modelli che rappresentano esplicitamente i componenti della scena e poi lasciando che queste rappresentazioni interagiscano tra loro attraverso architetture di apprendimento profondo», spiega l’autore. Oltre al quadro di riferimento, il progetto ha fornito nuove conoscenze sul «come e perché» questi modelli funzionano. «Abbiamo dimostrato che è il modo specifico in cui questi modelli apprendono a migliorare le loro capacità di generalizzazione», osserva.

Tempi entusiasmanti per l’IA

Secondo Globerson, queste conquiste sono il risultato diretto del suo team di ricercatori, che ha affrontato le sfide presentate con entusiasmo, rigore, creatività e diligenza. Molti di questi ricercatori applicheranno le competenze e le conoscenze acquisite durante il progetto alla loro carriera accademica o industriale. «Sono orgoglioso dei numerosi contributi che il nostro team ha apportato all’IA, sia in termini di sviluppo di architetture di IA olistiche che di comprensione del perché e del come tali modelli funzionano», osserva. Questo, insieme al contributo del progetto alla teoria dell’apprendimento profondo, all’introduzione di un paradigma di prompting visivo e alla scoperta del modo in cui i trasformatori eseguono l’apprendimento nel contesto, hanno ispirato il lavoro successivo. «Questi sono tempi entusiasmanti per l’IA e i temi chiave che abbiamo esplorato nel progetto sono ancora in gran parte aperti», conclude il ricercatore. «Sono certo che le idee e le tecniche che abbiamo introdotto durante il progetto HOLI contribuiranno a rispondere a queste domande, migliorando in ultima analisi la capacità dell’IA di formare un significato da immagini, video e testi».

Scopri altri articoli nello stesso settore di applicazione

Il mio fascicolo 0 0