El gigante de los motores de búsqueda Google lanzó el miércoles su Gemini 2.0, un modelo experimental que puede utilizar sitios web por sí solo y es básicamente un modelo “para todo”
Según Sundar Pichai, director ejecutivo de Google, el último modelo permitirá a los usuarios crear nuevos agentes de IA que nos acerquen a nuestra visión de un asistente universal. La compañía ha descrito su modelo como el más capaz jamás creado para la era de los agentes.
Las iniciativas forman parte de los esfuerzos de la empresa en la creciente competencia de la industria tecnológica contra empresas como Meta, Microsoft y Meta.
Google implementará el modelo en todos sus productos
Pichai también reveló el último modelo, con capacidades multimodales que se implementará en todos sus productos, incluyendo salida nativa de imagen y audio. El gigante de los motores de búsqueda lanzó Gemini 1.0 en diciembre del año pasado, el cual, según Google, fue el primer modelo "multimodal nativo", lo que sugiere que podría procesar y responder consultas de texto, video, imagen, audio y código.
La última versión representa los últimos esfuerzos de Google en la carrera cada vez más competitiva de inteligencia artificial en la industria tecnológica.
“Si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”
Pichai.
Gemini 2.0 llega casi 10 meses después del lanzamiento de la versión 1.5 de Google. Según Google, el modelo aún se encuentra en fase experimental, con solo una versión disponible: la Flash 2.0, más pequeña y de gama baja.
Demis Hassabis, director ejecutivo de Google DeepMind y responsable de los esfuerzos de inteligencia artificial de la empresa, dijo que este seguía siendo un gran día para el gigante tecnológico.
"Es tan bueno como el modelo Pro actual. Así que se puede considerar un nivel superior, con la misma relación calidad-precio, rendimiento y velocidad. Estamos muy satisfechos con ello", explicó Hassabis.
Actualmente, sólo los desarrolladores y evaluadores son los primeros en obtener la versión 2.0, mientras que otros usuarios de Gemini tienen acceso al modelo experimental Flash 2.0, que se basa en Flash 1.5, que se lanzó como el modelo más rápido y más rentable.
Google anunció una serie de nuevas funciones
Según la compañía, se espera incorporar las capacidades de razonamiento del nuevo modelo a la función AI Overviews, que ya está disponible para mil millones de usuarios, según Pichai. Pichai ha indicado que se está convirtiendo en una de las funciones de búsqueda más populares del grupo.
Con este nuevo modelo, Pichai destacó además que AI Overviews ahora podrá abordar consultas complejas de varios pasos, por ejemplo, ecuacionesmaticy preguntas multimodales.
Si bien las pruebas limitadas para el modelo más nuevo comenzaron esta semana, la función de razonamiento recién estará accesible para más usuarios a principios del próximo año.
Según Google, el modelo de razonamiento se ejecuta en el chip de inteligencia artificial de sexta generación del gigante de los motores de búsqueda , Trillium, que también estuvo disponible para los clientes de Google Cloud el miércoles.
En su publicación , Google reveló que el nuevo chip ofrece un rendimiento cuatro veces mejor y es un 67% más eficiente energéticamente que su predecesor.
Damos inicio a nuestra era Gemini 2.0 con Gemini 2.0 Flash, que duplica la velocidad de la versión 1.5 Pro en las pruebas de rendimiento clave (ver gráfico a continuación). Me entusiasma especialmente ver el rápido progreso en la programación, y hay más por venir.
Los desarrolladores pueden probar una versión experimental en IA… pic.twitter.com/iEAV8dzkaW
– Sundar Pichai (@sundarpichai) 11 de diciembre de 2024
El CEO de Google también anunció otras funciones, como la nueva función de Gemini, Deep Research, que funciona como asistente de investigación mediante razonamiento avanzado y capacidades de contexto extenso. Esta nueva función, disponible en Gemini Advanced, permite compilar informes de investigación en nombre del usuario.
Hassabis dijo que Gemini 2.0 estaba sentando las bases para un gran 2025.
“Realmente vemos el año 2025 como el verdadero comienzo de la era basada en agentes”
Hassabis.
Esto ocurre cuando la compañía anunció el lanzamiento de otro producto, Project Mariner , una nueva extensión experimental de Chrome que literalmente puede usar un navegador web para los usuarios.
Además, Google también anunció Jules, un agente creado específicamente para ayudar a los desarrolladores a encontrar y corregir código defectuoso, y un nuevo agente basado en Gemini 2.0 que puede mirar las pantallas de los usuarios y ayudarlos a jugar mejor a videojuegos.
Según Hassabis, el agente de juego al que llama “huevo de Pascua” apunta a que es verdaderamente multimodal.

