LINGUATEC IA, un projecte per avançar en la digitalització de l’aragonès, el català, el basc i l’occità, per mitjà de la intel·ligència artificial
Aquest projecte europeu transpirinenc i transfronterer ha establert les bases per desenvolupar coneixement en intel·ligència artificial aplicable a les llengües amb pocs recursos de tots dos costats del Pirineu, i té l’objectiu d’aplicar nous models de llenguatge generatius en aquestes llengües.
El processament del llenguatge és una eina poderosa per a les comunitats amb llengües que tenen recursos escassos. Ajuda a revitalitzar la llengua i a promoure’n l’ús de manera efectiva. És de vital importància per a aquestes llengües pujar a l’onada de la intel·ligència artificial, per no quedar-se enrere. La qualitat que s’ha assolit en el processament del llenguatge natural no està a l’abast de totes les llengües, i la col·laboració resulta fonamental per desenvolupar nous recursos i eines lingüístiques. Cal incrementar l’esforç en innovació, apostant per la recerca aplicada en intel·ligència artificial en el processament del llenguatge natural.
L’objectiu del projecte europeu EFA 104/01-LINGUATEC IA (Intel·ligència Artificial), cofinançat pel Fons Europeu de Desenvolupament Regional a través de la 1a convocatòria INTERREG POCTEFA 2021-2027, és desenvolupar coneixement en intel·ligència artificial sobre nous models de llenguatge generatius aplicables a llengües amb pocs recursos i utilitzar-lo per avançar en la digitalització de l’aragonès, del català, del basc i de l’occità (llengües del territori POCTEFA) i en la construcció d’una infraestructura lingüística i intel·ligent transfronterera que faciliti la comunicació entre els parlants de les diferents llengües i l’accés multilingüe a informació.
El consorci d’aquest projecte transfronterer —liderat per Elhuyar (a través del seu centre d’intel·ligència artificial Orai) i format per Lo Congrès permanent de la lenga occitana, HITZ zentroa (UPV/EHU), la Universitat Jean Jaurès de Tolosa, la Universitat de Perpinyà, l’IKER-CNRS de Baiona, el Govern de l’Aragó i la Universitat de Lleida— ha establert les bases de treball en la reunió inicial celebrada el 15 de gener a Usurbil (Guipúscoa). El consorci està format per entitats d’alt nivell que conformen una comunitat científica a l’entorn de les sis llengües del Pirineu, amb l’objectiu de recuperar-les i revitalitzar-les. Aquest projecte contribueix a l’articulació social i cultural del territori transfronterer, per mitjà del reforç d’un element clau de la cultura local, les llengües.
En aquest sentit, les entitats participants en el projecte treballen ja en diferents àmbits relacionats amb el processament del llenguatge, com és el desenvolupament de nous algorismes i arquitectures neuronals adaptats a situacions de còmput i recursos lingüístics limitats. Així mateix, es vol millorar els sistemes de transcripció, traducció automàtica neuronal i síntesi de veu del basc, el català, l’occità, l’aragonès i les seves variants dialectals, que combinin amb el francès i l’espanyol, i també desenvolupar una plataforma lingüística multilingüe de subtitulat i doblatge automàtic. A més, està previst crear una plataforma o repositori en línia amb tots els recursos, tecnologies i aplicacions que desenvolupem per a les llengües dels Pirineus.
Les entitats que componen aquest projecte creuen que el seu treball serà de gran ajuda tant per a la comunitat investigadora i professional que treballa en l’àmbit de les llengües i la seva digitalització, com per a les entitats públiques i privades que podran millorar els seus serveis i fer-los accessibles en diferents idiomes, i s’enorgulleixen de proporcionar a la ciutadania recursos i eines vàlides que ajudin a comunicar-se més fàcil en un entorn multilingüe.
El projecte LINGUATEC IA no és un projecte que neix ara. Es tracta d’un projecte que recull el testimoni de LINGUATEC, projecte previ cofinançat amb fons POCTEFA, finalitzat ja, en el qual després de tres anys de trajecte i l’alt nivell de desenvolupament assolit, les entitats sòcies van fer un pas de caràcter estratègic i van consolidar una xarxa d’excel·lència en intel·ligència artificial per construir una infraestructura lingüística transfronterera.
Share on Facebook Share on Twitter Share on Pinterest