22 jul. 2025

El chatbot con inteligencia artificial ChatGPT ahora puede “ver, oír y hablar”

La startup OpenAI anunció que su sistema de conversación basado en la inteligencia artificial (IA), ChatGPT, ahora implementará una herramienta con la capacidad de “ver, oír y hablar”.

chatgpt.jpg

El sistema ChatGTP ya está disponible en Paraguay.

Foto: Archivo ÚH

OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció este lunes una nueva versión de su popular herramienta que es capaz de “ver, oír y hablar” en voz alta con los usuarios.

Hasta ahora solo se podía interactuar con las distintas versiones de ChatGPT por escrito, pero los usuarios de pago en “dos semanas” podrán tener una conversación en voz alta y escuchar las respuestas de la máquina, así como mandar fotos, imágenes, capturas de pantalla y documentos al chat para obtener respuestas específicas.

Por su parte, los que usan la versión gratuita de esta herramienta podrán sacarles partido a estas nuevas actualizaciones “poco después”, según OpenAI.

“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, anota la empresa en un comunicado.

Puede leer: ¿Cómo funciona la prueba gratis de ChatGPT en Paraguay?

Mientras que para ejemplificar cómo se puede usar la herramienta de voz, la empresa dice que se puede utilizar para “contar un cuento o resolver un debate”.

Por ahora, este asistente de voz ―que es similar a Alexa, de Amazon, y a Siri, de Apple,― estará disponible para iOS y Android, pero no en PC.

Se podrán elegir entre cinco voces distintas, aunque la voz que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.

Mediante Whisper ―herramienta de OpenAI que usa la IA para trascribir audio― se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.

“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advierte la empresa.

OpenAI, además, anunció este lunes que la plataforma de música Spotify está utilizando el “poder de esta tecnología para traducir algunos de sus pódcast a “idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados”.

Foto: EFE

Más contenido de esta sección
Un equipo de astrónomos ha captado imágenes que pueden corresponder a un planeta aún en formación que talla un intrincado patrón en el gas y el polvo que rodean a la joven estrella, informó este lunes el Observatorio Europeo Austral (ESO).
Poseer un celular antes de los 13 años compromete la salud mental en la juventud adulta, según los resultados de un estudio realizado con datos de más de 100.000 jóvenes, que recoge este lunes la revista científica Journal of Human Development and Capabilities.
El análisis de las observaciones del telescopio espacial James Webb está produciendo hallazgos espaciales inimaginables como el que acaban de lograr un grupo de investigadores españoles: la reconstrucción en tres dimensiones del entorno de Jekyll, una galaxia “muerta” que dejó de producir estrellas hace más de 500 millones de años.
El papa León XIV pidió este domingo “dejar las armas” y señaló que “el mundo no soporta más” la guerra en una breve declaración a los periodistas a la salida de la misa dominical que celebró en la catedral de Albano, junto a su residencia estiva en Castel Gandolfo (centro).
El Ejército israelí mató el domingo al menos a 81 gazatíes e hirió a unos 150 tras abrir fuego contra un grupo de personas que aguardaban la llegada de camiones con harina en la norteña urbe de Beit Lahia, mientras que seis gazatíes más fueron asesinados en Rafah (sur) cerca de uno de los puntos de distribución de ayuda respaldados por EEUU, confirmaron a EFE fuentes médicas.
Sudán anunció este domingo que se restringirán las llamadas de voz y las videollamadas de WhatsApp a partir del próximo 25 de julio alegando razones de seguridad, informó la Autoridad Reguladora de Telecomunicaciones y Correos sudanesa (TPRA, en inglés).