Google lanza Gemini 2.0 y afirma que es un modelo para “todo”

Por

Enacy Mapakame

3 minutos de lectura 11 de diciembre de 2024

Google lanza Gemini 2.0 y afirma que es un modelo para “todo”

Google hizo el miércoles una serie de anuncios, incluido el lanzamiento de Gemini 2.0.
El modelo es un modelo multimodal y “máximo capaz”.
Google lanzará el modelo a más usuarios el próximo año.

El gigante de los motores de búsqueda Google lanzó el miércoles su Gemini 2.0, un modelo experimental que puede utilizar sitios web por sí solo y es básicamente un modelo “para todo”

Según Sundar Pichai, CEO de Google, el modelo más reciente permitirá a los usuarios crear nuevos agentes de IA que “nos acercan a nuestra visión de un asistente universal”. La compañía ha descrito su modelo como el más “avanzado hasta la fecha para la era de los agentes”.

Las iniciativas forman parte de los esfuerzos de la empresa en la creciente competencia de la industria tecnológica contra empresas como Meta, Microsoft y Meta.

Google implementará el modelo en todos sus productos

Pichai también reveló el último modelo, con capacidades multimodales que se implementará en todos sus productos, incluyendo salida nativa de imagen y audio. El gigante de los motores de búsqueda lanzó Gemini 1.0 en diciembre del año pasado, el cual, según Google, fue el primer modelo "multimodal nativo", lo que sugiere que podría procesar y responder consultas de texto, video, imagen, audio y código.

La última versión representa los últimos esfuerzos de Google en la carrera cada vez más competitiva de inteligencia artificial en la industria tecnológica.

“Si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”

Pichai.

Gemini 2.0 llega casi 10 meses después del lanzamiento de la versión 1.5 de Google. Según Google, el modelo aún se encuentra en fase experimental, con solo una versión disponible: la Flash 2.0, más pequeña y de gama baja.

Demis Hassabis, director ejecutivo de Google DeepMind y responsable de los esfuerzos de inteligencia artificial de la empresa, dijo que este seguía siendo un gran día para el gigante tecnológico.

"Es tan bueno como el modelo Pro actual. Así que se puede considerar un nivel superior, con la misma relación calidad-precio, rendimiento y velocidad. Estamos muy satisfechos con ello", explicó Hassabis.

Actualmente, sólo los desarrolladores y evaluadores son los primeros en obtener la versión 2.0, mientras que otros usuarios de Gemini tienen acceso al modelo experimental Flash 2.0, que se basa en Flash 1.5, que se lanzó como el modelo más rápido y más rentable.

Google anunció una serie de nuevas funciones

Según la compañía, se espera incorporar las capacidades de razonamiento del nuevo modelo a la función AI Overviews, que ya está disponible para mil millones de usuarios, según Pichai. Pichai ha indicado que se está convirtiendo en una de las funciones de búsqueda más populares del grupo.

Con este nuevo modelo, Pichai destacó además que AI Overviews ahora podrá abordar consultas complejas de varios pasos, por ejemplo, ecuacionesmaticy preguntas multimodales.

Si bien las pruebas limitadas para el modelo más nuevo comenzaron esta semana, la función de razonamiento recién estará accesible para más usuarios a principios del próximo año.

Según Google, el modelo de razonamiento se basa en el chip de IA de sexta generación del gigante de los motores de búsqueda^,Trillium, que también estuvo disponible para los clientes de Google Cloud el miércoles.

En su publicación, Google reveló que el nuevo chip ofrece un rendimiento cuatro veces mejor y es un 67% más eficiente energéticamente que su predecesor.

Damos inicio a nuestra era Gemini 2.0 con Gemini 2.0 Flash, que duplica la velocidad de la versión 1.5 Pro en las pruebas de rendimiento clave (ver gráfico a continuación). Me entusiasma especialmente ver el rápido progreso en la programación, y hay más por venir.

Los desarrolladores pueden probar una versión experimental en IA… pic.twitter.com/iEAV8dzkaW

– Sundar Pichai (@sundarpichai) 11 de diciembre de 2024

El CEO de Google también anunció otras funciones, como la nueva función de Gemini, Deep Research, que funciona como asistente de investigación mediante razonamiento avanzado y capacidades de contexto extenso. Esta nueva función, disponible en Gemini Advanced, permite compilar informes de investigación en nombre del usuario.

Hassabis dijo que Gemini 2.0 estaba sentando las bases para un gran 2025.

“Realmente vemos el año 2025 como el verdadero comienzo de la era basada en agentes”

Hassabis.

Esto ocurre cuando la compañía anunció el lanzamiento de otro producto, Project Mariner, una nueva extensión experimental de Chrome que literalmente puede usar un navegador web para los usuarios.

Además, Google también anunció Jules, un agente creado específicamente para ayudar a los desarrolladores a encontrar y corregir código defectuoso, y un nuevo agente basado en Gemini 2.0 que puede mirar las pantallas de los usuarios y ayudarlos a jugar mejor a videojuegos.

Según Hassabis, el agente de juego al que llama “huevo de Pascua” apunta a que es verdaderamente multimodal.

No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.

Google

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Enacy Mapakame

Enacy Mapakame es periodista con más de 10 años de experiencia en noticias empresariales y financieras. Cubre mercados de capitales y tecnologías emergentes: el metaverso, la IA y las criptomonedas. Enacy es licenciada con honores en Estudios de Medios y Sociedad.

ÍNDICE

1. Google implementará el modelo en todos sus productos

2. Google anunció una serie de nuevas funciones

Comparte este artículo