Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
Deep Learning for Holistic Inference

Article Category

Article available in the following languages:

Verbesserung der Fähigkeit von KI, aus Texten und Bildern eine Bedeutung abzuleiten

Neue Modelle des tiefen Lernens sind nachweislich in der Lage, Text-, Bild- und Videoeingaben ganzheitlich zu interpretieren.

Die menschliche Intelligenz ist beeindruckend. „Alleine durch das Betrachten unserer Umgebung können wir sofort Rückschlüsse darauf ziehen, was vor sich geht und wer beteiligt ist“, sagt Amir Globerson(öffnet in neuem Fenster), Informatikprofessor an der Universität Tel Aviv(öffnet in neuem Fenster). „Wenn wir ein Buch lesen, machen wir uns ein Bild von der Welt, die darin beschrieben wird.“ Künstliche Intelligenz (KI) leistet zwar Beachtliches, kommt aber nach wie vor nicht an die Fähigkeit des menschlichen Geistes heran, die Bedeutung der einzelnen Komponenten zu einem kohärenten Verständnis des Ganzen zu verbinden. Diese Fähigkeit ist aber absolut entscheidend für den Einsatz von KI, zum Beispiel bei selbstfahrenden Autos, in der Robotik und in der medizinischen Diagnostik. Hier kommt HOLI(öffnet in neuem Fenster) ins Spiel, ein EU-finanziertes Projekt, das KI zu einem ganzheitlicheren Verständnis von Text- und Bildeingaben verhelfen soll.

Ein Rahmen für die Entwicklung von Modellen des tiefen Lernens

Das vom Europäischen Forschungsrat(öffnet in neuem Fenster) unterstützte Projekt lieferte einen innovativen Rahmen, der für die Entwicklung von Modellen des tiefen Lernens verwendet werden kann und eine umfassende Interpretation ihrer Eingaben ermöglicht. „Wir erreichten dies, indem wir Modelle erstellten, die explizit Komponenten von Szenen darstellen. Diese ließen wir dann über Architekturen des tiefen Lernens miteinander interagieren“, erklärt Globerson. Darüber hinaus lieferte das Projekt neue Erkenntnisse über das „Wie“ und das „Warum“ dieser Modelle. „Wir haben gezeigt, dass die spezifische Art und Weise, wie diese Modelle lernen, ihre Fähigkeit zur Generalisierung verbessert“, meint Globerson.

Spannende Zeiten für KI

Globerson zufolge sind diese Erfolge das unmittelbare Ergebnis seines Forschungsteams, das mit Begeisterung, Sorgfalt, Kreativität und Fleiß an die gestellten Herausforderungen heranging. Viele dieser Forschenden werden die Fähigkeiten und Kenntnisse, die sie während des Projekts erworben haben, in ihrer akademischen oder industriellen Laufbahn zur Anwendung bringen. „Ich bin stolz auf die vielen Beiträge, die unser Team zur KI geleistet hat, sowohl im Hinblick auf die Entwicklung ganzheitlicher KI-Architekturen als auch auf das Verständnis, warum und wie solche Modelle funktionieren“, merkt Globerson an. Diese Erfolge sowie die Beiträge des Projekts zur Theorie des tiefen Lernens, zur Einführung eines visuellen Paradigmas der Eingabeaufforderung und zur Entdeckung, wie Transformatoren kontextbezogenes Lernen durchführen, haben zu Folgearbeiten geführt. „Dies sind aufregende Zeiten für die KI, und die Schlüsselthemen, die wir im Rahmen des Projekts erkundet haben, sind noch weitgehend offen“, so Globerson abschließend. „Ich bin zuversichtlich, dass die Ideen und Techniken, die wir im Rahmen des Projekts HOLI eingeführt haben, dazu beitragen werden, diese Fragen zu beantworten. Letztlich wird die Forschungsarbeit die Fähigkeit der KI, aus Bildern, Videos und Texten Bedeutung zu gewinnen, verbessern.“

Entdecken Sie Artikel in demselben Anwendungsbereich

Mein Booklet 0 0