Améliorer la capacité de l’IA à déduire le sens d’un texte ou d’une image
L’intelligence humaine est une chose remarquable. «En regardant simplement notre environnement, nous pouvons immédiatement tirer des conclusions sur ce qui se passe et sur les personnes impliquées", explique Amir Globerson(s’ouvre dans une nouvelle fenêtre), professeur d’informatique à l’Université de Tel Aviv(s’ouvre dans une nouvelle fenêtre). «En lisant un livre, nous nous faisons une image mentale du monde qui y est décrit.» Si l’intelligence artificielle (IA) est impressionnante, elle peine encore à égaler la capacité de l’esprit humain à relier la signification des composants individuels pour créer une compréhension cohérente de l’ensemble. Mais cette compétence est absolument essentielle pour l’utilisation de l’IA, par exemple, dans les domaines suivants: voitures autonomes, robotique et diagnostics médicaux. C’est là qu’intervient HOLI(s’ouvre dans une nouvelle fenêtre), un projet financé par l’UE qui vise à aider l’IA à acquérir une compréhension plus globale des données textuelles et visuelles.
Un cadre pour la conception de modèles d’apprentissage profond
Le projet, qui a reçu le soutien du Conseil européen de la recherche(s’ouvre dans une nouvelle fenêtre), a fourni un cadre innovant permettant de concevoir des modèles d’apprentissage profond capables de parvenir à une interprétation complète de leurs entrées. «Nous y sommes parvenus en construisant des modèles qui représentent explicitement les composants de la scène, puis en laissant ces représentations interagir entre elles via des architectures d’apprentissage profond», explique Amir Globerson. Outre le cadre, le projet a permis de mieux comprendre le «comment et le pourquoi» de ces modèles. «Nous avons démontré que c’est la manière spécifique dont ces modèles apprennent qui renforce leurs capacités de généralisation», note Amir Globerson.
Une période passionnante pour l’IA
Selon Amir Globerson, ces réalisations sont le résultat direct de son équipe de chercheurs, qui a relevé les défis qui se présentaient à elle avec enthousiasme, rigueur, créativité et diligence. Nombre de ces chercheurs appliqueront les compétences et les connaissances acquises au cours du projet à leur carrière universitaire ou industrielle. «Je suis fier des nombreuses contributions que notre équipe a apportées à l’IA, tant en termes de développement d’architectures d’IA holistiques que de compréhension du pourquoi et du comment de ces modèles», remarque Amir Globerson. Ces éléments, ainsi que la contribution du projet à la théorie de l’apprentissage en profondeur, l’introduction d’un paradigme d’incitation visuelle et la découverte de la manière dont les transformateurs effectuent l’apprentissage en contexte, ont tous inspiré des travaux ultérieurs. «Nous vivons une époque passionnante pour l’IA, et les thèmes clés que nous avons explorés dans le cadre du projet sont encore largement ouverts», conclut Amir Globerson. «Je suis convaincu que les idées et les techniques que nous avons introduites dans le cadre du projet HOLI permettront de répondre à ces questions et, en définitive, d’améliorer la capacité de l’IA à donner un sens aux images, aux vidéos et aux textes.»