Un modelo de parlache instruyiu ta l’occitán
“Un d’os obchetivos d’o proyecto Linguatec-IA ye crear un modelo de parlache instruyiu ta l’occitán”, explica Xabier Arregi, investigador d’o centro HiTZ. O modelo de parlache instruyiu ye capable de comprender o que le pide a persona usuaria y d’ofreixer resultaus que respondan adecuadament a ditas peticions. Ye un modelo, por tanto, capable de responder a las peticions d’a persona usuaria. “Ta ixo, en primerías empecipiamos a replegar datos de l’occitán. Replegamos os pocos datos con os cuals contabanos y los ordenamos. Digo que no en i hai guaires porque l’occitán conta con muit pocos datos si lo comparamos con as luengas mayoritarias. Amás, teniemos una dificultat adicional, ya que l’occitán tiene muitas variants dialectals y manca d’una luenga estandard, o que complica considerablement iste proceso y toz os trangos posteriors”.
Malas que teniemos replegaus os datos, s’empecipia a fase experimental, ye dezir, as labors d’entrenamiento ta crear modelos. Ta ixo, “emplegamos a mesma estratechia que hemos usau ta l’euskera: nos hemos basau en un modelo de parlache ya elaborau anteriorment. Decidimos emplegar o modelo Clama 3.1, un modelo multilingüe, pero que sabe prencipalment anglés. Ixo nos permitió partir de dito modelo y continar entrenando-lo ta que amostrase tamién contenius u testos en occitán”.
L’equipo investigador ha realizau dos prebas diferents. “Ta crear o modelo instruyiu de l’occitán hemos emplegau un metodo usau por o centro Orai d’Elhuyar y unatro usau por o centro Hitz. Por tanto, hemos creau os dos primers modelos de parlache instruyius a partir d’ixos dos experimentos”, adhibe Arregi. Ditos modelos son, de bela manera, resultaus de laboratorio y “agora somos avaluando a suya capacidat ta completar de forma satisfactoria as fayenas que les pedimos. En iste momento nos trobamos en ixa fase d’avaluazión, comprebando, por eixemplo, cómo funcionan con a traducción automatica”, explica Arregi.
Share on Facebook Share on Twitter Share on Pinterest