Voz reconocida

Dos jóvenes estudiantes de Ingeniería Electrónica crearon un programa que reconoce el guaraní hablado y lo transcribe al lenguaje escrito, una herramienta que abre múltiples posibilidades de uso. Los inventores explican cómo nació y cuál es el futuro de este emprendimiento.

  • Facebook
  • Twitter
  • Email
  • Print

Revista Vida

Por Carlos Darío Torres / Foto: Fernando Franceschelli.

El currículum de la carrera no lo exigía, pero su espíritu científico había hecho nacer en Rodrigo Villalba y Diego Maldonado las ganas de vivir el clima de un entorno de investigación. "¿Y si hacemos un reconocedor del guaraní hablado?”, se preguntaron. Así se puso en marcha una buena idea que, ahora, apunta a transformarse en una útil herramienta.
Diego y Rodrigo cursan actualmente el quinto año, el último, de la carrera de Ingeniería Electrónica en la Facultad Politécnica de la Universidad Nacional de Asunción (UNA). Y en medio de las clases ordinarias, encuentran tiempo para seguir perfeccionando su creación que, esperan, sirva no solo a los posibles usuarios, sino también a otros investigadores como base para nuevos proyectos.

Evolución
“Al principio teníamos pensado hacer un reconocedor de voz en español para controlar un robot pequeño. Era una aplicación sencilla, pero como la terminamos muy rápido, se nos ocurrió desarrollarla para que pueda reconocer también expresiones en guaraní”, cuenta Diego.
Terminar el reconocedor de voz en español les llevó un mes más o menos, lapso que transcurrió entre la lectura de teorías y un poco de investigación. “Fue relativamente sencillo”, asegura Rodrigo.
Sin embargo, desarrollar el reconocedor de guaraní fue un poco más complicado, porque todavía no se había hecho nada parecido. Estaba el método, pero no existía ninguna base ya realizada para el trabajo que pensaban encarar. Había que empezar desde cero.
Los estudiantes utilizaron el mismo procedimiento que con el reconocedor de español, pero antes tuvieron que estudiar la estructura del guaraní, su fonética y su gramática, en fin, todo lo relacionado con el idioma nativo.
No fue la única tarea, porque además hubo que llevar adelante investigaciones en matemáticas, necesarias para el procesamiento. “Eso nos llevó entre dos y tres meses de investigación. Y después, cuando ya teníamos bien definido cómo hacerlo, el desarrollo nos tomó otros dos meses, más o menos”, relata Rodrigo.
Diego agrega que aunque parezca lo contrario no les tomó tanto tiempo concretar el proyecto, pero aclara: “Lógicamente, si querés tener algo más trabajado, eso va a llevar más tiempo; el programa todavía está en fase de desarrollo, pero se puede decir que ya funciona bastante bien. Nosotros queremos seguir puliéndolo. El proyecto en base ya terminó, pero hay que mejorar y para eso necesitamos la ayuda de la gente”.
La colaboración del público vino inicialmente a través de las donaciones de voz, que los interesados pueden hacer ingresando a la página del proyecto . La persona que quiera ayudar debe ingresar a la página e ir a la pestaña que dice “donar voz”, leer la oración en guaraní que está en la cajita y enviar.
“Tenemos una versión para computadora y otra para celular. Hay un tutorial de cómo hacer las donaciones y también un acerca de. Lo primero que hicimos fue subir el reconocedor para que la gente note que funciona, para que se entusiasme con el proyecto y vea cómo va a quedar al final”, señala Rodrigo.

El futuro en sus manos
Los creadores aclaran que por ahora la demanda de donadores de voz casi está completa y que a partir de este punto lo que queda es introducir los ajustes necesarios para mejorar el programa y proyectarlo hacia nuevas herramientas.
¿Cuáles podrían ser esas herramientas y su uso? “La idea es utilizar el programa para hacer algo más complejo, como un traductor guaraní-español que puede ser un trabajo futuro basado específicamente en esto; esa tarea se la dejamos a otros investigadores, aunque no descartamos hacer el trabajo nosotros”, añade Diego.
La creación de Rodrigo y Diego usa exclusivamente el guaraní, pero más adelante se podría ampliar al jopara; claro que en ese caso, ambos estudiantes deben volver al principio, ya que hay que mezclar otra vez “una parte en guaraní y otra en castellano, y hacer esa mezcla es más difícil”.
Un invento así podría servir para subtitular programas de televisión o, si se desarrolla el traductor, utilizarlo en asistentes personales para personas con discapacidad. “Una idea que nos dieron es, por ejemplo, la situación en la que un anciano está en su residencia, quiere mover la cama o que le ayuden con cualquier otra tarea, pero solo sabe hablar en guaraní; entonces, con nuestro programa puede darse a entender”, dice Rodrigo.
Los jóvenes afirman que en ningún momento pensaron en comercializar su invento y que su meta inicial se reducía a crear el reconocedor de voz, que funcione sin dificultades y que el público pueda acceder a él. Y que los informáticos interesados en hacer una aplicación puedan diseñarla basándose en su creación.
“Nuestra idea es concursar en conferencias internacionales de inteligencia artificial. Con eso cerraríamos el círculo”, apuntan. De la inquietud y curiosidad científica de dos jóvenes nació una herramienta que tiene un vasto horizonte de utilidad. Los creadores tienen la palabra.

  • Facebook
  • Twitter
  • Email
  • Print