ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

¿Qué puede hacer GPT-4o de OpenAI?

PorIbiam WayasIbiam Wayas
Lectura de 2 minutos.
¿Qué puede hacer GPT-4o de OpenAI?
  • El último modelo de OpenAI, ChatGPT-4o, “parece una IA de las películas”
  • Puede aceptar y devolver solicitudes en cualquier combinación de texto, audio e imágenes.
  • Responde con una voz más empática que la que tendría un modelo de IA típico.

OpenAI presentó el lunes su último modelo estrella, llamado GPT-4o ("o" de "omni"), y parece ser lo más cerca que hemos estado de tener un asistente inteligente como "Jarvis" en la película de Iron Man. 

La ventaja de ChatGPT-4o es que admite diferentes modalidades, algo que la mayoría de los modelos de IA existentes no pueden. Esto significa que GPT-4o puede aceptar y generar cualquier combinación de solicitudes de texto, audio e imagen.

La demostración que el equipo presentó en X (anteriormente Twitter) fue tan impresionante que muchos la entusiasmaron. Una gran hazaña es que GPT-4o responde a las entradas de audio en tan solo 232 milisegundos, un tiempo similar al de una persona durante una conversación.

"Parece una IA de película; y todavía me sorprende un poco que sea real", escribió Sam Altman, director ejecutivo de OpenAI, en una entrada de blog el lunes. "Lograr tiempos de respuesta y expresividad a nivel humano supone un gran cambio"

OpenAI ha comenzado a implementar las funciones de texto e imagen de GPT-4o para los usuarios. En las próximas semanas, las capacidades de audio y video estarán disponibles para un pequeño grupo de socios de confianza en la API, según informó la compañía. 

No obstante, aquí se muestran algunas de las cosas que puedes hacer con el modelo ChatGPT-4o. 

Cosas que puedes hacer con GPT-4o

Crea imágenes con textos legibles

Hasta ahora, algunos generadores de imágenes de IA como Midjourney aún tienen dificultades para crear imágenes con textos legibles. OpenAI afirmó que GPT-4o ahora comprende mucho mejor las descripciones de texto y puede crear textos legibles en las imágenes. 

Fuente de la imagen: OpenAI

Traducción en tiempo real

En una situación donde se necesita un traductor, GPT-4o puede actuar como tal. En una demostración en video, el equipo de OpenAI demostró que GPT-4o podía repetir lo que se decía en inglés en español, quizás en otros idiomas, y viceversa.

Mira y cuenta

Para personas con discapacidad visual, o simplemente por diversión, ChatGPT-4o puede ver y saber qué sucede a su alrededor a través de la cámara del teléfono. En una ocasión, el modelo pudo saber que alguien estaba celebrando un cumpleaños al ver un cake y una vela en la habitación.

Resolver problemas de matemáticas

GPT-4o también puede analizar problemas matemáticos en una hoja de papel o en una pantalla y dar la respuesta. Además, puede guiarte para aprender a resolverlos.

IA en reuniones visuales

GPT-4o puede unirse a reuniones visuales y mantener conversaciones con los participantes. También puede ayudar a los usuarios a prepararse para entrevistas de trabajo. 

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO