Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Deep Learning for Holistic Inference

Article Category

Article available in the following languages:

Mejora de las capacidades de la inteligencia artificial para para interpretar el significado de textos e imágenes

Unos modelos de aprendizaje profundo innovadores han demostrado su capacidad para interpretar de forma integral información en forma de texto, imagen y vídeo.

La inteligencia humana es algo extraordinario. «Con tan solo mirar a nuestro alrededor, podemos sacar conclusiones rápidas sobre lo que está ocurriendo y quién está implicado», afirma Amir Globerson(se abrirá en una nueva ventana), catedrático de Informática en la Universidad de Tel Aviv(se abrirá en una nueva ventana). «Al leer un libro, creamos una imagen mental del mundo que se describe en él». Si bien el potencial de la inteligencia artificial (IA) es asombroso, aún no logra igualar la capacidad humana de conectar el significado de las distintas partes de un conjunto para crear una comprensión holística y coherente. Pero esta habilidad es absolutamente fundamental para el uso de la IA, por ejemplo, en coches autónomos, robótica y diagnóstico médico. Aquí es donde entra en juego el proyecto financiado con fondos europeos HOLI(se abrirá en una nueva ventana), cuyo objetivo era ayudar a la IA a comprender mejor la información presente en textos e imágenes.

Un marco para el diseño de modelos de aprendizaje profundo

En el proyecto, que contó con el apoyo de Consejo Europeo de Investigación(se abrirá en una nueva ventana), se desarrolló un marco innovador para diseñar modelos de aprendizaje profundo capaces de lograr una interpretación integral de sus datos de entrada. «Lo logramos creando modelos que representan de forma explícita los componentes de una escena y, a continuación, permitiendo que esas representaciones interactúen entre sí a través de arquitecturas de aprendizaje profundo», explica Globerson. Además del marco, el proyecto aportó nuevos conocimientos sobre «cómo y por qué» funcionan estos modelos. «Demostramos que es la forma específica en que estos modelos aprenden lo que mejora su capacidad de generalización», comenta Globerson.

Tiempos apasionantes para la IA

Según Globerson, estos logros son el resultado directo del trabajo de su equipo de investigadores, que afrontaron los retos planteados con entusiasmo, rigor, creatividad y dedicación. Muchos de ellos aplicarán las habilidades y conocimientos adquiridos durante el proyecto en sus futuras carreras, ya sea en el ámbito de la investigación o en la industria. «Estoy orgulloso de las muchas aportaciones que nuestro equipo ha hecho al campo de la IA, tanto en el desarrollo de arquitecturas integrales como en la comprensión de por qué y cómo funcionan esos modelos», apunta Globerson. Esto, junto con la contribución del proyecto a la teoría del aprendizaje profundo, la introducción de un paradigma de indicaciones visuales y el descubrimiento de cómo los transformadores llevan a cabo el aprendizaje en contexto, ha servido de inspiración para trabajos posteriores. «Son tiempos apasionantes para la IA, y los temas principales que analizamos en el proyecto todavía ofrecen amplias oportunidades para avanzar», concluye Globerson. «Estoy seguro de que las ideas y técnicas que desarrollamos en el proyecto HOLI contribuirán a responder a estas cuestiones y, en último término, a mejorar la capacidad de la IA para interpretar imágenes, vídeos y textos».

Descubra otros artículos del mismo campo de aplicación

Mi folleto 0 0