El mundo de la inteligencia artificial dio un paso más allá con el lanzamiento de la nueva versión del chatbot ChatGPT, denominada GPT-4o (“o” de “omni”), presentada por OpenAI el pasado lunes. Esta versión no solo responde a solicitudes combinando audio, imagen y texto, sino que también incorpora características emocionales, convirtiéndose en una herramienta versátil y más humana. A continuación, se detallan las seis nuevas funciones y las críticas recibidas durante la presentación.
Novedades de GPT-4o:
- Conversaciones fluidas y emotivas: GPT-4o puede responder a peticiones de audio en un tiempo récord, mostrando un tono conversacional y cálido. Además, es capaz de generar voz en diferentes estilos emotivos, desde dramático hasta sarcástico.
- “Sé mis ojos”: Esta función permite a la IA describir en tiempo real escenas visuales para usuarios con discapacidad visual, identificando objetos y emociones en imágenes.
- Traducción en tiempo real: GPT-4o actúa como traductor durante conversaciones entre personas que hablan diferentes idiomas, aunque con algunos errores. También puede identificar objetos en imágenes y decir su nombre en otro idioma.
- Asistencia en reuniones: La IA puede transcribir, tomar notas y resumir reuniones virtuales, facilitando la colaboración y la organización de información.
- Ayuda con las matemáticas: GPT-4o puede guiar a estudiantes en la resolución de problemas matemáticos, ofreciendo explicaciones y correcciones durante el proceso.
- Generación de imágenes: Incorpora funcionalidades de herramientas de generación de imágenes, como la capacidad de crear imágenes a partir de comandos de texto.
Las fallas:
Durante la demostración, GPT-4o mostró algunas fallas, como confundir objetos o intervenir de manera inesperada en la conversación. Estos errores destacan la necesidad de seguir trabajando en la mejora de la precisión y fiabilidad del chatbot.
A pesar de las críticas, el lanzamiento de GPT-4o marca un avance significativo en la evolución de los asistentes virtuales. OpenAI busca convertir a ChatGPT en un asistente virtual completo, capaz de interactuar de manera más natural y versátil con los usuarios. Si bien aún quedan desafíos por superar, la nueva tecnología muestra un prometedor potencial para revolucionar la manera en que interactuamos con la inteligencia artificial.