Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

DEep COgnition Learning for LAnguage GEneration

Description du projet

Déverrouiller l’avenir de la compréhension et du traitement des langues

Ces dernières années, les modèles d’apprentissage profond basés sur des transformateurs, tels que BERT et GPT-3, nous ont éblouis par leurs prouesses en matière de traitement du langage naturel (TLN), démontrant des capacités remarquables de transfert et d’apprentissage à court terme. Cependant, ces modèles trébuchent souvent lorsqu’ils sont poussés au-delà de leur zone de confort, car ils manquent d’adaptabilité en dehors du domaine, de compréhension du contexte, d’étalonnage et de mémoire traçable. Financé par le Conseil européen de la recherche, le projet DECOLLAGE relèvera ces défis. Plus précisément, il s’agira de développer une production contrôlée guidée par l’utilité avec des estimations d’incertitude. Il intégrera également les informations contextuelles de manière efficace et élaborera des modèles de mémoire éparse. DECOLLAGE favorise le traitement conscient par le biais de représentations descriptives de l’attention et permet une communication transparente entre les modules et les agents. Avec des applications couvrant la traduction automatique, le dialogue ouvert et la génération d’histoires, DECOLLAGE veillera à ce que l’évolution du TLN reste à la pointe du progrès.

Objectif

In recent years, transformer-based deep learning models such as BERT or GPT-3 have led to impressive results in many natural language processing (NLP) tasks, exhibiting transfer and few-shot learning capabilities.

However, despite faring well in benchmarks, current deep learning models for NLP often fail badly in the wild: they are bad at out-of-domain generalization, they do not exploit contextual information, they are poorly calibrated, and their memory is not traceable. These limitations stem from their monolithic architectures, which are good for perception, but unsuitable for tasks requiring higher-level cognition.

In this project, I attack these fundamental problems by bringing together tools and ideas from machine learning, sparse modeling, information theory, and cognitive science, in an interdisciplinary approach. First, I will use uncertainty and quality estimates for utility-guided controlled generation, combining this control mechanism with the efficient encoding of contextual information and integration of multiple modalities. Second, I will develop sparse and structured memory models, together with attention descriptive representations towards conscious processing. Third, I will build mathematical models for sparse communication (reconciling discrete and continuous domains), supporting end-to-end differentiability and enabling a shared workspace where multiple modules and agents can communicate.

I will apply the innovations above to highly challenging language generation tasks, including machine translation, open dialogue, and story generation. To reinforce interdisciplinarity and maximize technological impact, collaborations are planned with cognitive scientists and with a scale-up company in the crowd-sourcing translation industry.

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

HORIZON-ERC - HORIZON ERC Grants

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2022-COG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

INSTITUTO DE TELECOMUNICACOES
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 1 790 220,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 1 790 220,00

Bénéficiaires (2)

Mon livret 0 0