L’automatisation de l’aranais progresse rapidement

19 January, 2026 By

L’aranais est la variante gasconne de l’occitan parlée dans le Val d’Aran (Lleida). C’est la langue officielle dans toute la Catalogne, avec le catalan et l’espagnol ; elle s’appuie sur un statut légal et est présente dans l’enseignement, des niveaux obligatoires jusqu’à l’administration locale. Selon l’enquête des usages linguistiques de la population 2023 (« Encuesta de Usos Lingüísticos de la Población 2023 »), la majeure partie des habitants de 15 ans ou plus (sur un total de 10 500 habitants, environ) comprend l’aranais (presque 80%), 53% disent le parler et 23,4% l’utilisent comme leur langue habituelle. Même si son usage est à peu près stable face aux changements démographiques récents, la langue a toujours une présence sociale limitée dans des domaines comme le commerce et l’administration non locale, et l’absence d’outils technologiques limite largement la production de ressources en aranais et la présence de la langue dans l’environnement numérique.

L’objectif du projet Linguatec-IA est de progresser dans le domaine des technologies de la langue basées sur l’intelligence artificielle pour des langues disposant de peu de moyens, parmi celles-ci l’occitan et ses variantes comme l’aranais. « Concernant l’aranais, l’objectif de Linguatec-IA – indique Helena Torres, docteure de l’Université de Lleida – est de munir la langue d’outils avancés d’intelligence artificielle comparables à ceux disponibles pour les langues majoritaires.  L’Université de Lleida, en collaboration étroite avec Lo Congrès permanent de la lenga occitana, développe actuellement des ressources linguistiques de qualité et des technologies applicables à l’aranais et à des couples de langues comme aranais-catalan et aranais-espagnol ».

Les lignes de travail définies dans le cadre du projet Linguatec-IA comprennent la création de corpus, la normalisation numérique, le support de modèles neuronaux multilingues et l’intégration de ces technologies dans des services pratiques pour les citoyen.ne.s, l’administration et l’enseignement. Notre intention est que l’aranais dispose d’une infrastructure numérique moderne garantissant son utilisabilité, sa visibilité et sa viabilité dans les environnements technologiques actuels.

« Nous travaillons actuellement en parallèle avec divers domaines en rapport avec l’automatisation de l’aranais. Grâce à des initiatives comme Linguatec-IA, l’état de l’automatisation de l’aranais progresse rapidement et est prêt à faire un saut qualitatif », a ajouté Torres. Pour le deuxième semestre 2026, il est prévu de disposer d’une synthèse et d’une reconnaissance vocales en aranais ; d’un dictionnaire numérique de grande qualité, pouvant être intégré dans des applications linguistiques (pour améliorer les actuels et adapter ceux existant déjà en format analogique) ; d’une traduction automatique texte à texte, qui permettra de développer des extensions pour les navigateurs, des systèmes de traduction de sites web et des outils de soutien pour l’administration ; et d’un système de sous-titrage automatique et de traduction voix à voix, fondamentaux pour que la langue puisse être accessible et ait une présence audiovisuelle.

« Tout cela couvrira le couple aranais-catalan et, idéalement également le couple aranais-espagnol, permettant une utilisation fluide de la langue dans des environnements numériques et améliorant de manière significative sa présence dans l’écosystème technologique. Si nous y parvenons, nous serons en mesure de placer l’aranais dans une position avantageuse claire en vue de sa normalisation numérique et de sa projection future », a-t-elle conclu.