S’ha presentau en Bayona Linguatec-IA, en a siede d’o centro d’investigación IKER-CNRS

21 February, 2025 By

L’euskera d’o País Basco norte tamién tendrá lo suyo puesto en o prochecto y IKER-CNRS s’encargará d’integrar la suya visión en as investigacions y aplicacions que se fagan en o prochecto Linguatec-IA.

S’ha celebrau un acto de presentación d’os detalles de Linguatec-IA los días 20 y 21 de febrero de 2025, en Bayona, aproveitando la reunión ordinaria d’os miembros d’o consorcio d’o prochecto.

Itziar Cortes, representant de Elhuyar y coordinadora d’o prochecto, ha explicau a los asistents las principals claus de Linguatec-IA: “Linguatec-IA ye un prochecto cooperativo pa fomentar lo desenrollo dichital d’as luengas minoritarias”. Cortes ha subrayau la importancia que tiene pa las luengas minorizadas lo desenrollo d’o procesamiento d’o luengache natural a traviés d’este prochecto: “Lo procesamiento d’o luengache ye una ferramienta potent pa las luengas minoritarias, ya que contribuye a la revitalización d’a luenga y a la promoción eficaz d’o suyo uso. En o procesamiento d’o luengache natural no totas las luengas tienen las mesmas oportunidaz, y la colaboración ye fundamental pa lo desenrollo de nuevos recursos y ferramientas pa las luengas minorizadas”.

Contino ha preso la parola Urtzi Etxeberria, director d’IKER-CNRS. Etxeberria ha sinyalau que “pa aconseguir las ferramientas d’intelichencia artificial adecuadas pa l’euskera ye fundamental fer cuenta d’as luengas d’os dos costaus d’a buega, y ye lo que se fará en o prochecto Linguatec-IA, que permitirá que l’euskera d’o País Basco norte salga reforzau”. En concreto, lo Centro d’Investigación IKER contribuyirá a lo prochecto Linguatec-IA en este sentiu: “Aportamos la nuestra conoixencia d’a lingüistica basca y d’o tratamiento automatico d’as luengas, ya que este espacio d’encerca tiene experiencia en a cheneración de recursos pa l’euskera”.

A la zaguería, Oihane Cantero, investigadora en o centro d’intelichencia artificial Orai, promoviu per Elhuyar, ha informau d’os abances d’os zaguers anyos en o campo d’a intelichencia artificial: “Los Modelos de Luengache Extensos (Large Language Models u LLM) han produciu grans transformacions perque son capables de comprender y producir la luenga humana”. Cantero, experta en a materia, explica las dificultaz que tienen las luengas minorizadas pa desenvolver modelos lingüisticos tan grans: «Los LLM asimilan las suyas capacidaz lingüisticas a partir de conchuntos chigants de datos de texto. Las luengas chicotas, per un costau, tienen menos datos (textos) y, per l’atro, no tienen capacidat de computación suficient pa maniar grans cantidaz de datos.» Asinas, ha subrayau la necesidat de trobar nuevos camins pa no quedar-se dezaga y tamién la colaboración entre luengas minorizadas.