Se ha presentado en Bayona Linguatec-IA, en la sede del centro de investigación IKER-CNRS

21 febrero, 2025 By

El euskera del País Vasco norte también tendrá su lugar en el proyecto e IKER-CNRS se encargará de integrar su visión en las investigaciones y aplicaciones que se realicen en el proyecto Linguatec-IA.

Se ha celebrado un acto de presentación de los pormenores de Linguatec-IA los días 20 y 21 de febrero de 2025, en Bayona, aprovechando la reunión ordinaria de los miembros del consorcio del proyecto.

Itziar Cortes, representante de Elhuyar y coordinadora del proyecto, ha explicado a los asistentes las principales claves de Linguatec-IA: “Linguatec-IA es un proyecto cooperativo para fomentar el desarrollo digital de las lenguas minoritarias”. Cortes ha subrayado la importancia que tiene para las lenguas minorizadas el desarrollo del procesamiento del lenguaje natural a través de este proyecto: “El procesamiento del lenguaje es una herramienta potente para las lenguas minoritarias, ya que contribuye a la revitalización de la lengua y a la promoción eficaz de su uso. En el procesamiento del lenguaje natural no todas las lenguas tienen las mismas oportunidades, y la colaboración es fundamental para el desarrollo de nuevos recursos y herramientas para las lenguas minorizadas”.

A continuación ha tomado la palabra Urtzi Etxeberria, director de IKER-CNRS. Etxeberria ha señalado que “para conseguir las herramientas de inteligencia artificial adecuadas para el euskera es fundamental tener en cuenta los lenguajes de ambos lados de la frontera, y es lo que se hará en el proyecto Linguatec-IA, que permitirá que el euskera del País Vasco norte salga reforzado”. En concreto, el Centro de Investigación IKER contribuirá al proyecto Linguatec-IA en este sentido: “Aportamos nuestro conocimiento de la lingüística vasca y del tratamiento automático de las lenguas, puesto que este espacio de investigación tiene experiencia en la generación de recursos para el euskera”.

Por último, Oihane Cantero, investigadora en el centro de inteligencia artificial Orai, promovido por Elhuyar, ha informado de los avances de los últimos años en el campo de la inteligencia artificial: “Los Modelos de Lenguaje de Gran Tamaño (Large Language Models o LLM) han dado lugar a grandes transformaciones porque son capaces de comprender y producir la lengua humana”. Cantero, experta en la materia, explica las dificultades que tienen las lenguas minorizadas para desarrollar modelos lingüísticos tan grandes: «Los LLM asimilan sus capacidades lingüísticas a partir de gigantescos conjuntos de datos de texto. Las lenguas pequeñas, por una parte, tienen menos datos (textos) y, por otra, no tienen capacidad de computación suficiente para manejar grandes cantidades de datos.» Así, ha subrayado la necesidad de encontrar nuevos caminos para no quedarse atrás y también la colaboración entre lenguas minorizadas.