Google ha puesto a disposición de todos los usuarios de Android su función de chatbot de IA con tecnología de voz, Gemini Live, de forma gratuita. La función, que permite a los usuarios hablar con el Chatbot AI de Google mediante comandos de voz, anteriormente estaba completamente disponible para los suscriptores de Gemini Advanced.
La nueva característica permite a todos los usuarios de Android utilizar las funciones de diálogo del chatbot, que ahora incluyen hacer preguntas por voz e interrumpir las respuestas en el proceso.
Este anuncio se produce después del primer lanzamiento de la aplicación Gemini Live el mes pasado en el evento Pixel 9 de Google. Los usuarios de Android ahora pueden habilitar fácilmente la función directamente presionando un ícono de forma de onda dentro de la aplicación Gemini que les permite comenzar a usar interacciones de voz con la IA. El lanzamiento se produce en un momento en que la función competidora de Open AI, el Modo de voz avanzado para ChatGPT, aún no se ha implementado por completo.
Los usuarios ahora pueden acceder al modo de voz de Gemini con más control
La funcionalidad más notable de Gemini Live incluye la capacidad de que los usuarios hagan preguntas en voz alta, interrumpan las respuestas en medio de una oración y elijan diferentes voces para las respuestas de la IA. Esta función de manos libres agrega cierto grado de flexibilidad y personalización, lo que hace que las conversaciones con la IA sean más fluidas y receptivas. Además de gestionar la discusión en tiempo real, los participantes también pueden "retener" las respuestas o "finalizar" la conversación en cualquier momento cuando sea necesario.
Aunque, al principio, la capacidad de control por voz era una característica de un servicio pago, esta característica de voz ahora está disponible en la versión gratuita de la aplicación Gemini. Los usuarios de Android pueden comenzar a usar la aplicación o la superposición para tener acceso a ella de inmediato. Actualmente, el modo de voz está optimizado solo para admitir el idioma inglés; sin embargo, Google ha confirmado planes para agregar más idiomas y hacer que esta función también esté disponible en dispositivos iOS, aunque no se ha proporcionado un cronograma exacto.
Google lanza Gemini Live mientras la función de voz de OpenAI se queda atrás
El momento de este lanzamiento coloca a Google por delante de OpenAI, que dio a conocer su modo de voz avanzado para ChatGPT en mayo. Sin embargo, esta característica ofrecida por Open AI aún no está ampliamente disponible, ya que su disponibilidad es limitada desde finales de julio. Otros expertos de la industria sugirieron además que el largo período de espera puede deberse a la alta potencia computacional necesaria para respaldar las interacciones de IA basadas en voz, especialmente a gran escala.
La decisión de Google de lanzar Gemini Live de forma gratuita contrasta con el lanzamiento escalonado de OpenAI de una función similar. Mientras OpenAI sigue desarrollando una estrategia para una adopción más amplia, el lanzamiento de Google pone Gemini Live en manos de usuarios que desean interactuar con la IA hablando en lugar de escribir, lo que lo convierte en una ventaja competitiva entre las dos empresas.
Actualmente, se puede acceder a Gemini Live en dispositivos Android y Google planea agregar más funciones a medida que desarrolle el servicio.