A gigante dos mecanismos de busca, Google, lançou na quarta-feira o Gemini 2.0, um modelo experimental capaz de utilizar sites de forma autônoma e que, basicamente, serve "para tudo"
Segundo Sundar Pichai, CEO do Google, o modelo mais recente permitirá aos usuários criar novos agentes de IA que “nos aproximam da nossa visão de um assistente universal”. A empresa descreveu seu modelo como o mais “capaz já criado para a era dos agentes”.
As iniciativas fazem parte dos esforços da empresa em meio à crescente concorrência no setor de tecnologia contra empresas como Meta, Microsoft e Meta.
O Google implementará o modelo em todos os seus produtos
Pichai também revelou o modelo mais recente, com recursos multimodais que serão implementados em todos os seus produtos, incluindo saída nativa de imagem e áudio. A gigante das buscas lançou o Gemini 1.0 em dezembro do ano passado, que o Google afirmou ser o primeiro modelo "nativamente multimodal", sugerindo que o modelo poderia processar e responder a consultas de texto, vídeo, imagem, áudio e código.
A versão mais recente representa os esforços mais recentes do Google na corrida cada vez mais competitiva da inteligência artificial na indústria de tecnologia.
“Se o Gemini 1.0 era sobre organizar e compreender informações, o Gemini 2.0 é sobre torná-las muito mais úteis.”
Pichai.
O Gemini 2.0 chega quase 10 meses depois do lançamento inicial do 1.5 pelo Google. De acordo com o Google, o modelo ainda está em fase experimental de pré-visualização, com apenas uma versão lançada: o 2.0 Flash, menor e mais básico.
Demis Hassabis, CEO do Google DeepMind e chefe dos esforços da empresa em IA, afirmou que este ainda era um grande dia para a gigante da tecnologia.
“É tão bom quanto o modelo Pro atual. Então, você pode considerá-lo um nível acima, com a mesma relação custo-benefício, eficiência de desempenho e velocidade. Estamos muito satisfeitos com isso”, explicou Hassabis.
Atualmente, apenas desenvolvedores e testadores são os primeiros a receber a versão 2.0, enquanto outros usuários do Gemini têm acesso ao modelo experimental Flash 2.0, que é baseado na versão 1.5 Flash, lançada como o modelo mais rápido e econômico.
O Google anunciou uma série de novos recursos
Segundo a empresa, a expectativa é adicionar os recursos de raciocínio do novo modelo à funcionalidade Visão Geral de IA, que já está acessível a um bilhão de usuários, de acordo com Pichai. Ele indicou que essa funcionalidade está se tornando uma das mais populares do grupo.
Com esse novo modelo, Pichai destacou ainda que o AI Overviews agora será capaz de lidar com consultas complexas de várias etapas, como, por exemplo, equaçõesmatice perguntas multimodais.
Embora os testes limitados do modelo mais recente tenham começado esta semana, o recurso de raciocínio só estará disponível para mais usuários no início do próximo ano.
6ª da gigante das buscas , o Trillium, que também ficou disponível para os clientes do Google Cloud na quarta-feira.
Em sua postagem , o Google revelou que o novo chip oferece desempenho 4 vezes melhor e é 67% mais eficiente em termos de energia do que seu antecessor.
Estamos dando início à era Gemini 2.0 com o Gemini 2.0 Flash, que supera o 1.5 Pro em benchmarks importantes com o dobro da velocidade (veja o gráfico abaixo). Estou particularmente entusiasmado com o rápido progresso na programação, e muito mais está por vir.
Os desenvolvedores podem experimentar uma versão experimental em IA… pic.twitter.com/iEAV8dzkaW
-Sundar Pichai (@sundarpichai) 11 de dezembro de 2024
O CEO do Google também anunciou outros recursos, como o novo recurso do Gemini conhecido como Deep Research, que pode funcionar como um assistente de pesquisa usando raciocínio avançado e recursos de contexto extenso. Esse novo recurso está disponível no Gemini Advanced e é capaz de compilar relatórios de pesquisa em nome do usuário.
Hassabis afirmou que o Gemini 2.0 estava lançando as bases para um excelente ano de 2025.
“Consideramos 2025 como o verdadeiro início da era baseada em agentes.”
Hassabis.
Isso ocorre no mesmo dia em que a empresa anunciou o lançamento de outro produto, o Project Mariner , uma nova extensão experimental para o Chrome que pode literalmente usar um navegador da web para os usuários.
Além disso, o Google também anunciou o Jules – um agente criado especificamente para ajudar desenvolvedores a encontrar e corrigir códigos defeituosos – e um novo agente baseado no Gemini 2.0 que pode analisar as telas dos usuários e ajudá-los a jogar videogames melhor.
Segundo Hassabis, o agente do jogo, que ele chama de "easter egg", indica que ele é verdadeiramente multimodal.

