Linguatec-IA aurkeztu da Baionan, IKER-CNRS ikerketa-gunearen egoitzan

6 March, 2025 By

Iparraldeko euskara ere kontuan hartuko da proiektuan, eta IKER-CNRS arduratuko da ikuspegi hori Linguatec-IA proiektuan egingo diren ikerketa eta aplikazioetan txertatzeaz.

2025eko otsailaren 20 eta 21ean, Baionan, proiektuaren partzuergoko kideek ohiko bilera izan dutela baliatuz, Linguatec-IAren nondik norakoak aurkezteko ekitaldi bat antolatu dute.

Itziar Cortes Elhuyarreko ordezkari eta proiektuaren koordinatzaileak Linguatec-IAren gako nagusiak azaldu dizkie bertaratu direnei: “Hizkuntza gutxituen garapen digitala sustatzeko lankidetza-proiektua da Linguatec-IA”. Cortesek azaldu du hizkuntza txikientzat zer garrantzitsua den proiektu honen bidez hizkuntza naturalaren prozesamendua garatzea: “Hizkuntza-prozesamendua tresna indartsua da baliabide urriko hizkuntzentzat, hizkuntza biziberritzen eta haren erabilera eraginkortasunez sustatzen laguntzen baitu. Hizkuntza naturalaren prozesamenduan hizkuntza guztiek ez dituzte aukera berberak, eta lankidetza funtsezkoa da hizkuntza txikientzat baliabide eta tresna berriak garatzeko”.

Ondoren, IKER-CNRSko zuzendari Urtzi Etxeberriak hartu du hitza. Etxeberriak azaldu duenez, “euskararentzat adimen artifizialeko tresna egokiak lortzeko, funtsezkoa da mugaren alde bietako hizkerak kontuan hartzea, eta horixe egingo da Linguatec-IA proiektuan; horri esker, iparraldeko euskara indartuta aterako da”. Hain zuzen ere, IKER ikerketa-guneak ekarpen hori egingo dio Linguatec-IA proiektuari: “Euskal hizkuntzalaritzan eta hizkuntzen trataera automatikoan dugun ezagutza ekartzen dugu; izan ere, ikerketa-gune honek badu esperientzia euskararentzat baliabideak sortzen”.

Azkenik, adimen artifizialaren esparruan azken urteetan izan diren aurrerapenen berri eman du Oihane Canterok (ikertzailea da Elhuyarrek sustatutako Orai adimen artifizialeko zentroan): “Hizkuntza Eredu Handiek (Large Language Models edo LLMek) eraldaketa handiak ekarri dituzte, gai baitira gizakion hizkuntza ulertu eta sortzeko”. Hizkuntza txikiek halako hizkuntza-eredu handiak garatzeko zer zailtasun dituzten azaldu du arloan aditua den Canterok: “LLMek testu-datu multzo erraldoietatik ikasten dituzte hizkuntza-gaitasunak. Hizkuntza txikiek, batetik, ez dute hainbeste datu (testu) eta, bestetik, datu-kantitate handiak maneiatzeko behar adina konputazio-ahalmenik ere ez dute”. Hala, atzean ez geratzeko bide berriak aurkitu behar direla nabarmendu du, eta txikien arteko lankidetza azpimarratu.