La automatización del aranés avanza rápidamente
El aranés es la variedad gascona de la lengua occitana hablada en el Val d’Aran (Lleida). Es lengua oficial en toda Cataluña, junto con el catalán y el español, con estatus legal y presencia en la educación desde niveles obligatorios hasta la administración local. Según la Encuesta de Usos Lingüísticos de la Población 2023, la mayoría de la población de 15 años o más (del total aproximado de 10.500 habitantes) comprende el aranés (casi el 80 %), un 53,6 % lo dice hablar y alrededor del 23,4 % lo utiliza como lengua habitual. Aunque el uso mantiene cierta estabilidad frente a los cambios demográficos recientes, la lengua sigue teniendo presencia social limitada en ámbitos como el comercio o la administración no local, y la falta de herramientas tecnológicas limita en gran medida la producción de recursos en aranés y la presencia de la lengua en el entorno digital.
El proyecto Linguatec-IA busca avanzar en tecnologías lingüísticas basadas en inteligencia artificial para lenguas con pocos recursos, incluyendo el occitano y sus variantes como el aranés. “El objetivo de Linguatec-IA para con el aranés —señala Helena Torres, doctora de la Universidad de Lleida— es proveerlo de herramientas avanzadas de inteligencia artificial equiparables a las disponibles para lenguas mayoritarias. Desde la Universidad de Lleida, en estrecha colaboración con Lo Congrès permanent de la lenga occitana, estamos desarrollando recursos lingüísticos de calidad y tecnologías aplicables al aranés, y a pares de lenguas como aranés-catalán y aranés-castellano”.
Las líneas de trabajo trazadas en el marco del proyecto Linguatec-IA incluyen la creación de corpus, la normalización digital, el soporte a modelos neuronales multilingües y la integración de estas tecnologías en servicios prácticos para la ciudadanía, la administración y la educación. El objetivo es que el aranés disponga de infraestructura digital moderna que garantice su usabilidad, visibilidad y viabilidad en entornos tecnológicos actuales.
“Actualmente estamos trabajando de manera paralela en diferentes áreas relacionadas con la automatización del aranés. Gracias a iniciativas como Linguatec-IA, el estado de la automatización del aranés avanza rápidamente hacia un salto cualitativo”, añade Torres. Para el segundo semestre de 2026 está previsto disponer de síntesis y reconocimiento de voz en aranés; de un diccionario digital de alta calidad, apto para su integración en aplicaciones lingüísticas (mejorando los actuales y adaptando los existentes en formato analógico); de traducción automática de texto a texto, que permitirá desarrollar extensiones para navegadores, sistemas de traducción de sitios web y herramientas de apoyo a la administración; y de subtitulación automática y traducción de voz a voz, fundamentales para la accesibilidad y la presencia audiovisual de la lengua.
“Todo ello cubrirá el par aranés-catalán e, idealmente, también el par aranés-español, permitiendo un uso fluido de la lengua en entornos digitales y mejorando significativamente su presencia en el ecosistema tecnológico. De ser así, situaremos el aranés en una posición ventajosa clave para su normalización digital y su proyección futura”, concluye.
Share on Facebook Share on Twitter Share on Pinterest