Linguatec-IA a été présenté à Baiona, au siège du centre de recherche IKER-CNRS

21 February, 2025 By

Ce projet tient compte de l’euskara parlé au Pays Basque Nord, et le centre IKER-CNRS se chargera d’inclure cette langue dans les recherches et les applications réalisées dans le cadre du projet Linguatec-IA

Profitant de la réunion ordinaire des membres du consortium, qui a eu lieu le 20 et 21 février 2025 à Bayonne, une séance de présentation du projet Linguatec-IA a été organisée.

Itziar Cortes, représentante de l’Association Elhuyar et coordinatrice du projet a présenté aux participants les principales clés de Linguatec-IA: « Linguatec-IA est un projet de coopération conçu pour promouvoir le développement numérique des langues minorisées”. Cortes a insisté sur l’importance, pour ces langues disposant de peu de ressources, de renforcer à travers ce projet le traitement du langage naturel. Le traitement du langage – a-t-elle ajouté – est un outil puissant pour ces communautés linguistiques, car il contribue à revitaliser la langue et à en promouvoir efficacement son usage. La qualité du traitement du langage naturel n’est pas la même pour toutes les langues, aussi la collaboration est-elle essentielle pour pouvoir développer de nouvelles ressources et de nouveaux outils linguistiques ».

Le directeur de IKER-CNRS, Urtzi Etxeberria a ensuite pris la parole pour expliquer que « en ce qui concerne l’euskara, il est essentiel de tenir compte des différentes variantes dialectales parlées des deux côtés de la frontière, afin d’obtenir des outils adéquats dans le domaine de l’Intelligence Artificielle, et c’est précisément – a-t-il dit – le rôle de Linguatec-IA ; de ce fait, l’euskara parlé au Pays Basque Nord n’en sera que renforcé ». Telle sera la contribution du centre de recherche IKER-CNRS au projet Linguatec-IA : « nous apporterons nos connaissances en linguistique basque et dans le traitement du langage automatique, compte tenu de notre expérience dans la création d’outils pour l’euskara ».

Pour finir, Oihane Cantero (chercheuse au centre d’Intelligence Artificielle Orai promu par Elhuyar) a informé sur les progrès réalisés ces dernières années dans le domaine de l’Intelligence Artificielle : « les Grands Modèles de Langage (Large Language Models ou LLM) ont apporté des changements considérables, grâce à leur capacité à comprendre le langage humain et à le créer ». Cantero, spécialiste en la matière, a montré la difficulté des langues minorisées à développer ces grands modèles de langage : « Les LLMs se nourrissent de vastes ensembles de données de langage pour reconnaître et interpréter le langage humain. Les langues minorisées ne disposent ni d’un grand volume de données (de textes), ni d’une puissance de calcul suffisante pour traiter des quantités si grandes de données». De ce fait, a-t-elle souligné, il est indispensable d’explorer de nouvelles voies pour ne pas rester à la traîne, et favoriser la coopération entre ces langues.