L’automatització de l’aranès avança ràpidament
L’aranès és la varietat gascona de la llengua occitana parlada a la Val d’Aran (Lleida). És llengua oficial a tot Catalunya, juntament amb el català i el castellà, amb estatus legal i presència a l’educació des de nivells obligatoris i també a l’administració local. Segons l’Enquesta d’Usos Lingüístics de la Població 2023, la majoria de la població de 15 o més anys (del total aproximat de 10.500 habitants) comprèn l’aranès (gairebé el 80 %), un 53,6 % declara que el parla i al voltant del 23,4 % l’utilitza com a llengua habitual. Tot i que l’ús manté una certa estabilitat davant els canvis demogràfics recents, la llengua continua tenint presència social limitada en àmbits com el comerç o l’administració no local, i la manca d’eines tecnològiques limita en gran mesura la producció de recursos en aranès i la presència de la llengua a l’entorn digital.
El projecte Linguatec-IA cerca avançar en tecnologies lingüístiques basades en intel·ligència artificial per a llengües amb pocs recursos, incloent-hi l’occità i les seves variants com l’aranès. “L’objectiu de Linguatec-IA envers l’aranès -assenyala Helena Torres-Purroy, doctora de la Universitat de Lleida- és proveir-lo d’eines avançades d’intel·ligència artificial equiparables a les disponibles per a llengües majoritàries. Des de la Universitat de Lleida, en estreta col·laboració amb Lo Congrès permanent de la lenga occitana, estem desenvolupant recursos lingüístics de qualitat i tecnologies aranès-català i aranès-castellà”.
Les línies de treball traçades en el marc del projecte Linguatec-IA inclouen la creació de corpus, la normalització digital, el suport a models neuronals multilingües i la integració d’aquestes tecnologies en serveis pràctics per a la ciutadania, l’administració i l’educació. L’objectiu és que l’aranès disposi d’infraestructura digital moderna que en garanteixi l’usabilitat, la visibilitat i la viabilitat en entorns tecnològics actuals.
“Actualment estem treballant de manera paral·lela en diferents àrees relacionades amb l’automatització de l’aranès. Gràcies a iniciatives com Linguatec-IA, l’estat de l’automatització de l’aranès avança ràpidament cap a un salt qualitatiu”, afegeix Torres-Purroy. Per al segon semestre del 2026 està previst disposar de síntesi i reconeixement de veu en aranès; d’un diccionari digital d’alta qualitat, apte per integrar-lo en aplicacions lingüístiques (millorant els actuals i adaptant els existents en format analògic); de traducció automàtica de text a text, que permetrà desenvolupar extensions per a navegadors, sistemes de traducció de llocs web i eines de suport a l’administració; i de subtitulació automàtica i traducció de veu a veu, fonamentals per a l’accessibilitat i la presència audiovisual de la llengua.
“Tot això cobrirà el parell aranès-català i, idealment, també el parell aranès-espanyol, permetent un ús fluid de la llengua en entorns digitals i millorant significativament la seva presència a l’ecosistema tecnològic. Si és així, situarem l’aranès en una posició avantatjosa clau per a la seva projecció utura”, conclou la professora.
Share on Facebook Share on Twitter Share on Pinterest