LINGUATEC IA - un projet pour avancer dans la numérisation de l'aragonais, du catalan, du basque et de l'occitan

Ce projet européen transpyrénéen et transfrontalier jette les bases du développement de connaissances en intelligence artificielle applicables aux langues dites "à faibles ressources" de part et d'autre des Pyrénées : l'aragonais, le catalan, le basque et de l'occitan

  • Le 25 janv.

[Communiqué de Presse]

LINGUATEC AI, un proyecto para para avanzar en la digitalización del aragonés, catalán, euskera y occitano

25 janvier 2024

 

Cofinancé par FEDER (Fonds européen de développement régional) via le programme POCTEFA et dirigé par Elhuyar (via son centre d'intelligence artificielle Orai), il vise à appliquer de nouveaux modèles linguistiques génératifs dans ces langues.

Le traitement des langues est un outil puissant pour les communautés linguistiques sous-équipées, permettant de revitaliser la langue et de promouvoir efficacement son utilisation. Il est vital pour ces langues de surfer sur la vague de l'intelligence artificielle, afin de ne pas rester à la traîne. La qualité atteinte dans le traitement du langage naturel n'est pas accessible à toutes les langues, et la collaboration est essentielle pour développer de nouvelles ressources et de nouveaux outils linguistiques. Il est nécessaire d'accroître l'effort d'innovation, en investissant dans la recherche appliquée à l'intelligence artificielle dans le traitement du langage naturel.

L'objectif du projet européen LINGUATEC IA (Intelligence artificielle), cofinancé par le Fonds européen de développement régional par le biais de l'appel Interreg POCTEFA (code EFA 104/01), est de développer des connaissances en intelligence artificielle sur de nouveaux modèles linguistiques génératifs applicables aux langues disposant de peu de ressources et de les utiliser pour progresser dans la numérisation de l'aragonais, catalan, basque et occitan (langues du territoire POCTEFA) et dans la construction d'une infrastructure linguistique et intelligente transfrontalière pour faciliter la communication entre les locuteurs des différentes langues et l'accès multilingue de l'information.
 

POCTEFA AI Langues 2024

Le consortium de ce projet transfrontalier - dirigé par Elhuyar (à travers son centre d'intelligence artificielle Orai) est composé de Lo Congrés Permanent de la Lenga Occitana, HITZ zentroa (UPV/EHU), Université Jean Jaurès de Toulouse, Université de Perpignan (laboratoire LAMPS), IKER-CNRS de Baiona, Gouvernement d'Aragon et Université de Lleida. Il a jeté les bases lors de sa première réunion qui s'est tenue le 15 janvier dernier à Usurbil. Le consortium est composé "d'entités de haut niveau qui forment une communauté scientifique autour des six langues des Pyrénées, dans le but de les récupérer et de les revitaliser", explique Josu Aztiria, coordinateur du projet LINGUATEC. Ce projet "contribue à l'articulation sociale et culturelle du territoire transfrontalier, en renforçant un élément clé de la culture locale, les langues", ajoute-t-il.

En ce sens, les entités participant au projet travaillent déjà dans différents domaines liés au traitement des langues, tels que le développement de nouveaux algorithmes et d'architectures neuronales adaptés aux situations informatiques et aux ressources linguistiques limitées. De même, "nous voulons améliorer les systèmes de transcription, de traduction automatique neuronale et de synthèse vocale pour le basque, le catalan, l'occitan, l'aragonais et leurs variantes dialectales, qui se combinent avec le français et l'espagnol", explique M. Aztiria, "ainsi que développer une plateforme linguistique multilingue pour le sous-titrage et le doublage automatiques". En outre, "nous prévoyons de créer une plateforme ou un référentiel en ligne avec toutes les ressources, technologies et applications que nous développons pour les langues des Pyrénées", ajoute-t-il.

Les entités qui composent ce projet estiment que leur travail sera d'une grande utilité "tant pour la communauté des chercheurs et des professionnels travaillant dans le domaine des langues et de leur numérisation que pour les entités publiques et privées qui pourront améliorer leurs services et les rendre accessibles dans différentes langues", et elles sont fières de "fournir aux citoyens des ressources et des outils valables qui les aident à communiquer plus facilement dans un environnement multilingue".

Le projet LINGUATEC IA n'est pas un nouveau projet. C'est un projet qui prend le relais de LINGUATEC, un projet antérieur cofinancé par des fonds POCTEFA, déjà achevé, dans lequel, après trois ans de travail et le haut niveau de développement atteint, les entités partenaires ont franchi une étape stratégique et consolidé un réseau d'excellence en intelligence artificielle pour la construction d'une infrastructure linguistique transfrontalière.

 

Interreg POCTEFA

 

Plus d'Informations

Contact UPVD
Matthieu MARTEL
Vice-Président chargé des Relations Internationales
matthieu.martel@univ-perp.fr - Tél : +33 (0) 4 68 66 17 56

Contact général (Espagnol)
Alaitz IMAZ
komunikazioa@orai.eus - Tél : 747 400 121

 
Mise à jour le 25 janvier 2024
https://www.univ-perp.fr/linguatec-ia-un-projet-pour-avancer-dans-la-numerisation-de-laragonais-du-catalan-du-basque-et-de-loccitan