Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Resolving the Paradoxes of Cross-lingual Transfer in Multilingual Language Models

Objectif

The technical advances, and resulting societal opportunities, of Large Language Models (LLMs) have principally benefited communities whose primary languages are well-represented in the written data used for training LLMs (e.g. English). While these few high-resource languages are used by many around the world, they do not cover large segments of the global population of 8.2 billion, who collectively speak over 7000 languages. For intelligent natural language systems to be adopted and useful, they must enable interaction in the preferred languages of their users and be knowledgeable of the environments of those users. This expansion of LLM functionality requires re-thinking the cross-lingual transfer paradigm for enabling systems in low-resource languages. In an era where LLMs are knowledge bases, naive reasoners, and interactive agents, our intuitions that held for cross-lingual transfer to linguistic tasks will not extend to transferring regional and cultural knowledge understanding, which may differ even among similar languages.

In this proposal, we reformulate cross-lingual transfer using inference-time algorithms that dynamically localize, augment, and adapt implicit language and knowledge representations of multilingual LLMs for queries presented in any language. These new algorithms will leverage shared linguistic knowledge for cross-lingual transfer to new languages while disentangling regional and cultural knowledge that is tied to language but unique to individual language environments. Second, we will develop novel modular architectures to catalyze our adaptation algorithms by disentangling language and knowledge representations within multilingual LLMs during pretraining. Finally, we will develop new benchmarks, settings, and standards for reliable evaluation of regional knowledge in multilingual contexts.

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

HORIZON-ERC - HORIZON ERC Grants

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2025-STG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 1 499 597,00
Adresse
BATIMENT CE 3316 STATION 1
1015 LAUSANNE
Suisse

Voir sur la carte

Région
Schweiz/Suisse/Svizzera Région lémanique Vaud
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 1 499 597,00

Bénéficiaires (1)

Mon livret 0 0