13 ene. 2026

Buscan crear un corpus para fortalecer la IA en guaraní

¿La IA captó la diferencia entre “che mborayhu” y “rohayhu”?, se pregunta un grupo de jóvenes mientras navegan en las pantallas de sus notebooks en la sala de la Facultad de Ingeniería de la Universidad Nacional de Itapúa (UNI), donde ejercen de puente académico entre dos mundos aparentemente tímidos para el avance tecnológico actual: el idioma guaraní y la frontera digital de la inteligencia artificial (IA).

Se trata de un proyecto para fortalecer la inteligencia artificial en lengua guaraní que avanza con la creación de un corpus que busca alcanzar 500.000 oraciones traducidas y validadas, un insumo clave para el desarrollo tecnológico con identidad lingüística.

Según explicó el director del proyecto, MsC. Ing. Aldo Álvarez, actualmente cuentan con apenas “unas tres mil, cuatro mil oraciones”, por lo que aún “queda mucho por trabajar y por validar”.

En este laboratorio lingüístico, cada decisión sobre cómo traducir “ñande” o “ore” representa tanto un desafío como una postura filosófica sobre la identidad paraguaya. Álvarez explica que el proyecto tiene como eje la construcción de un conjunto de datos limpios y de alta calidad que permitan entrenar modelos de IA capaces de manejar el guaraní con precisión.

“Una tecnología va a ser tan buena como los datos que utiliza para aprender de ellos”, afirmó, al destacar la importancia de generar recursos lingüísticos robustos.

El ingeniero explicó que esta iniciativa incluye un “hackathon lingüístico” orientado a acelerar la recopilación y validación de oraciones en guaraní y castellano.

“Lo que estamos buscando hacer es construir un conjunto de datos de traducciones… que pueda ser el combustible para crear tecnología relacionada a la lengua y a la inteligencia artificial”, detalló.

En este sentido, el corpus será clave para mejorar herramientas que hoy presentan fallas al procesar el idioma. “ChatGPT ya tiene conocimiento de lo que es guaraní, pero… tiene muchas falencias”, dijo. Mencionó como ejemplo que “hay palabras que inventa, no distingue todavía entre nombres propios en guaraní”, limitaciones que buscan corregirse con este trabajo.

El especialista remarcó que la calidad del corpus será fundamental para desarrollar aplicaciones capaces de sugerir traducciones confiables y correcciones gramaticales en guaraní. “Tener ese conjunto de datos lo suficientemente grande y lo suficientemente correcto va a hacer que estas tecnologías puedan funcionar correctamente”, aseguró.

Destacó que esto es el inicio de un proceso más amplio que requiere colaboración nacional e internacional, especialmente el enfoque cultural del trabajo y reiteró que el objetivo es “crear ese corpus, ese conjunto de datos limpio que la inteligencia artificial pueda usar” para impulsar el desarrollo tecnológico del guaraní.

Lo que hacemos es juntar la mayor cantidad posible de oraciones, idealmente querríamos llegar a quinientas mil. Aldo Álvarez, ingeniero.

Más contenido de esta sección
El Operativo Verano 2026 del Ministerio de Salud Pública ha realizado 787 atenciones a través de los puestos sanitarios desplegados en distintas regiones del país.
En el Día Mundial de la Lucha contra la Depresión, que es conmemorado cada 13 de enero, profesionales instan a estar alertas, sobre todo en niños y adolescentes.
La Municipalidad de Asunción inició esta semana la eliminación de reductores de velocidad, conocidos como lomadas, que ya son innecesarios por estar en cruces semafóricos o en calles que pasaron a ser de un solo sentido.
En sesión de la Junta Municipal, ediles leales al intendente Luis Bello aprobaron la concesión de uso precario de un terreno público a favor de la firma Amarradero Servigen Naval SRL. Una concejala cuestionó el plazo otorgado para que la empresa presente plan de retiro, atendiendo a que sus actividades se realizan en la reserva del Banco San Miguel, considerada un área sensible y protegida en Asunción.
Profesional de la salud advierte sobre el uso de productos comercializados en redes sociales cuya venta no está autorizada por la Dirección Nacional de Vigilancia Sanitaria (Dinavisa).