ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

ChatGPT mejora su juego con funciones avanzadas de IA de voz, visión y más

PorAamir SheikhAamir Sheikh
3 minutos de lectura
Funciones de IA
  • OpenAI presenta la función de voz para ChatGPT, que permite respuestas de audio en múltiples personas.
  • La empresa se dirige a los usuarios en movimiento y a la competencia de los asistentes personales.
  • Los usuarios también pueden enviar imágenes y preguntas, ampliando las capacidades de ChatGPT.

En una importante actualización, OpenAI, la startup de inteligencia artificial (IA), ha incorporado innovadoras funciones de IA a su app ChatGPT, permitiendo al chatbot escuchar y hablar, además de analizar imágenes. Durante las próximas dos semanas, los usuarios podrán elegir entre cinco perfiles distintos para el chatbot, como "Juniper", "Breeze" y "Ember", cada uno con una voz única para las respuestas de audio. Este avance marca el último esfuerzo de OpenAI para que las conversaciones con chatbots basados ​​en IA sean aún más realistas y atractivas, dirigidas tanto a los suscriptores de su servicio ChatGPT Plus como a los usuarios empresariales.

Las conversaciones de los chatbots de IA se vuelven más humanas

ChatGPT de OpenAI, lanzado inicialmente en mayo, ya permitía interacciones de voz a texto con el chatbot. Ahora, los usuarios podrán seleccionar un personaje de voz, lo que hará que las conversaciones sean más dinámicas y naturales. Esta función de respuesta de audio busca acortar la distancia entre la interacción humana y la IA, fomentando una sensación de autenticidad en las conversaciones con el chatbot. OpenAI espera que esta mejoratraca los usuarios que buscan asistencia en cualquier lugar, lo que posiciona a ChatGPT en competencia directa con asistentes personales consolidados como el Asistente de Google, Siri de Apple y Alexa de Amazon.com.

Los usuarios pueden aprovechar esta función para diversas tareas, como solicitar información sobre la historia de Disneyland mientras conducen hacia el parque temático o pedir la receta de un cóctel mientras cocinan. Durante las pruebas, ChatGPT demostró su capacidad narrativa narrando un cuento divertido sobre una estrella de mar y un colinabo. Sin embargo, cabe destacar que, si bien ChatGPT puede generar letras de canciones, no presta su voz para cantar, lo que pone de manifiesto las limitaciones de la aplicación en cuanto a la interpretación vocal.

Las voces de ChatGPT pueden sonar relativamente humanas, aunque con un sutil matiz robótico. OpenAI colaboró ​​con actores de voz para desarrollar el modelo de IA de texto a voz que impulsa esta función, con el objetivo de ofrecer una experiencia conversacional más atractiva y convincente.

Ampliando capacidades con reconocimiento de imágenes

Además de la actualización de voz, OpenAI también anunció las próximas funciones de GPT-4, uno de los modelos avanzados de IA de ChatGPT. En las próximas semanas, los usuarios de pago y empresariales tendrán acceso a una función de reconocimiento de imágenes en la app y el sitio web de ChatGPT. Esta función permite a los usuarios enviar una imagen junto con una pregunta o solicitud relacionada, ampliando las capacidades de ChatGPT más allá de las interacciones de texto.

Por ejemplo, los usuarios pueden subir una imagen de unas gafas de sol rosas y pedirle al chatbot consejos de moda o sugerencias de atuendos que complementen el accesorio. También pueden enviar la imagen de un problema matemático complejo y solicitar ayuda para resolverlo. Esta función de reconocimiento de imágenes añade una nueva dimensión a la utilidad de ChatGPT, mejorando su versatilidad para usuarios de diversos ámbitos. Esta mejora supone un avance significativo en la transición entre la IA basada en texto y la información visual, abriendo nuevas posibilidades para una amplia gama de interacciones y aplicaciones de usuario.

Celebrando las funciones de IA mejoradas de ChatGPT

Las mejoras más recientes de OpenAI en ChatGPT representan un avance significativo en la continua evolución de basadas en IA . La incorporación de la capacidad de voz, con sus propias voces, junto con la ampliación de sus funciones para incluir el análisis de imágenes, demuestra el compromiso de OpenAI de ofrecer a los usuarios un entorno conversacional sumamente atractivo y multifacético. Si bien aún no está preparado para deleitar a los usuarios con melodías, la capacidad de ChatGPT para participar en diálogos dinámicos y sumamente realistas, además de responder con destreza a consultas relacionadas con imágenes, consolida su posición como una herramienta de IA sumamente potente e indispensable en el creciente campo de los asistentes virtuales y la inteligencia artificial conversacional.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Aamir Sheikh

Aamir Sheikh

Aamir es periodista especializado en tecnología con casi seis años de experiencia en los sectores de criptomonedas y tecnología. Se graduó de la Universidad MAJ con un MBA en Finanzas y Marketing. Actualmente trabaja en Cryptopolitan, donde informa sobre las últimas novedades en los mercados de criptomonedas y realiza predicciones de precios.

MÁS… NOTICIAS
CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS