Linguatec-IA contribue à éliminer les barrières linguistiques de la région des Pyrénées
La coordinatrice du projet Itziar Cortés Etxabe (Elhuyar) a présenté certains des points fondamentaux du projet Linguatec-IA lors du Ier Congrès International sur la Communication, la Technologie et les Langues Minoritaires organisé à Vielha (Val d’Aran) le 27 novembre dernier. Le congrès a été organisé par le Conselh Generau d’Aran, RTVE, l’Université Pompeu Fabra et l’Université de Lleida.
Cortés a participé avec Benaset Dazéas (Lo Congrès permanent de la lenga occitana) entre autres, à un colloque sur les projets d’innovation dans le domaine des technologies des langues minoritaires et l’IA. La coordinatrice du projet a proposé un résumé des antécédents historiques et a rappelé que, à l’instar du projet précédent Linguatec, « nous continuons à travailler avec un même objectif : contribuer à éliminer les barrières linguistiques de la région des Pyrénées en utilisant les technologies de la langue (au niveau de la recherche et au niveau des applications) ».
La représentante d’Elhuyar a présenté quelques-uns des résultats attendus du projet Linguatec-IA : Nous espérons d’une part accroître le nombre de ressources linguistiques de base tels que les travaux de documentation, la création de bases de données et le corpus ; nous continuerons par ailleurs à travailler dans le domaine des technologies de la langue en développant des traducteurs automatiques et d’autres technologies de base qui seront utilisées sur une plateforme finale de doublage automatique entre les langues des Pyrénées ». Un travail de recherche est par ailleurs en cours pour « créer des LLM pour les langues avec de faibles moyens ; un progrès important face aux technologies déjà disponibles pour les langues majoritaires », a-t-elle ajouté.
Les personnes participant à ce colloque ont tenu à souligner les difficultés auxquelles doivent faire face les langues avec peu de moyens pour relever les différents défis technologiques, comme, par exemple, la disposition d’une quantité de données moindre par rapport aux langues plus grandes, ou le fait que les modèles de langage sont conçus pour les langues hégémoniques. Les participants ont par ailleurs insisté sur le fait qu’il est nécessaire de disposer de nos propres stratégies pour développer les nouvelles technologies.
Share on Facebook Share on Twitter Share on Pinterest