Hizkuntza-eredu instruitua okzitanierarako

19 February, 2026 By

Okzitanierak hizkuntza-eredu instruitua behar du mundu digitalean bizirik iraun nahi duelako. Hizkuntza baten heriotza digitalak, berez, hizkuntza horren heriotza dakar. Mundu digitalean bizirik iraun nahi duen hizkuntzak derrigorrez garatu behar du teknologia, eta, teknologia-garapen horretan, gaur egun, hizkuntza-ereduak dira oinarrizko baliabide bat. Beraz, okzitanierak ere bere hizkuntza-eredu instruitua behar du; hau da, erabiltzaileen eskariak jaso, ulertu eta horren arabera erantzuna emateko gai diren hizkuntza-ereduak behar ditu.

Erraldoi teknologikoek badituzte jadanik okzitanierarako hizkuntza-eredu instruituak. Baina hizkuntza-eredu horiek haien esku daude eta haiek hartzen dituzte erabakiak. Okzitanierazko hizkuntza-komunitateak ez du erabaki horietan eragiteko aukerarik, eta horregatik da garrantzitsua komunitate horrek berak eta inguruko hizkuntza gutxituek teknologia propioa garatzea; hartara, erabaki ahal izateko zer egin eta nola jokatu hizkuntza-teknologia horiekin.

Hizkuntza-eredu instruitu batek bi osagai ditu. Batetik, hizkuntza-eredua bera: testua sortzeko gai den eredu bat, erdi eginda dagoen testu bati hurrengo hitza josiz testua osatzeko. Eta testu horrek izan behar du, nahitaez, testu koherente bat, gramatikalki zuzena eta, era berean, esanahi zentzuzkoa duena, nolabait munduaren inguruko ezagutza ere baduena. Bestetik, hizkuntza-eredu instruituak badu beste gaitasun bat: erabiltzaileak egiten dizkion eskaerak ulertzeko gai da, eta eskaera horien araberako emaitzak emateko ere bai. Erabiltzailearen eskaerei erantzuteko gai den eredua da.

“Linguatec-IA proiektuaren helburuetako bat da okzitanierarako hizkuntza-eredu instruitu bat sortzea —azaldu du Xabier Arregi HiTZ zentroko ikertzaileak—. Horretarako, lehenik, okzitanierazko datuak biltzen hasi ginen. Eskura genituen datu apurrak jaso eta txukundu egin genituen. Apurrak diot, dimentsioz hizkuntza handiekiko alderatuta oso datu gutxi dituelako okzitanierak. Gainera, zailtasun gehigarri bat izan genuen, zeren okzitanierak aldaera dialektal asko ditu eta ez dauka okzitaniera estandarrik; horrek prozesu hori eta ondorengo urrats guztiak nabarmen zailtzen ditu”.

Behin datu horiek bilduta, esperimentuak egiten hasi ziren, entrenamendu-lanak egin eta ereduak sortzeko. Horretarako, “euskararako erabili dugun estrategia bera erabili genuen: lehendik egindako hizkuntza-eredu bat hartu dugu oinarritzat. Erabaki genuen Llama 3.1 eredua erabiltzea: eredu eleaniztuna da, baina ingelesez nagusiki dakiena. Aukera ematen zigun eredu horretatik abiatu eta entrenatzen segitzeko, modu batera edo bestera, okzitanierazko edukiak edo testuak erakusteko baita ere”.

Ikertzaileek bi proba desberdin egin dituzte. “Esan liteke okzitanierazko eredu instruitua sortzeko erabili ditugula, batetik, Elhuyarreko Oraik erabilitako metodo bat eta Hitz zentroak erabilitako beste metodo bat. Beraz, bi esperimentu horietatik sortu dira lehenengo bi hizkuntza-eredu instruituak”, erantsi du Arregik. Eredu horiek nolabait laborategiko emaitzak dira, eta “orain ebaluatzen ari gara ea zenbateko gaitasuna duten eskatzen dizkiegun atazak ondo egiteko. Ebaluazio-fase horretan gaude une honetan; besteak beste, ikusten ea, adibidez, itzulpen automatikoan nola dabiltzan”, dio.