O Google lança o Gemini 2.0 e afirma que é um modelo para "tudo"

Por

Enacy Mapakame

Tempo de leitura: 3 minutos - 11 de dezembro de 2024

O Google lança o Gemini 2.0 e afirma que é um modelo para "tudo"

Na quarta-feira, o Google fez uma série de anúncios, incluindo o lançamento do Gemini 2.0.
O modelo é multimodal e "altamente capaz".
O Google disponibilizará o modelo para mais usuários no próximo ano.

A gigante dos mecanismos de busca, Google, lançou na quarta-feira o Gemini 2.0, um modelo experimental capaz de utilizar sites de forma autônoma e que, basicamente, serve "para tudo"

Segundo Sundar Pichai, CEO do Google, o modelo mais recente permitirá aos usuários criar novos agentes de IA que “nos aproximam da nossa visão de um assistente universal”. A empresa descreveu seu modelo como o mais “capaz já desenvolvido para a era dos agentes”.

As iniciativas fazem parte dos esforços da empresa em meio à crescente concorrência no setor de tecnologia contra empresas como Meta, Microsoft e Meta.

O Google implementará o modelo em todos os seus produtos

Pichai também revelou o modelo mais recente, com recursos multimodais que serão implementados em todos os seus produtos, incluindo saída nativa de imagem e áudio. A gigante das buscas lançou o Gemini 1.0 em dezembro do ano passado, que o Google afirmou ser o primeiro modelo "nativamente multimodal", sugerindo que o modelo poderia processar e responder a consultas de texto, vídeo, imagem, áudio e código.

A versão mais recente representa os esforços mais recentes do Google na corrida cada vez mais competitiva da inteligência artificial na indústria de tecnologia.

“Se o Gemini 1.0 era sobre organizar e compreender informações, o Gemini 2.0 é sobre torná-las muito mais úteis.”

Pichai.

O Gemini 2.0 chega quase 10 meses depois do lançamento inicial do 1.5 pelo Google. De acordo com o Google, o modelo ainda está em fase experimental de pré-visualização, com apenas uma versão lançada: o 2.0 Flash, menor e mais básico.

Demis Hassabis, CEO do Google DeepMind e chefe dos esforços da empresa em IA, afirmou que este ainda era um grande dia para a gigante da tecnologia.

“É tão bom quanto o modelo Pro atual. Então, você pode considerá-lo um nível acima, com a mesma relação custo-benefício, eficiência de desempenho e velocidade. Estamos muito satisfeitos com isso”, explicou Hassabis.

Atualmente, apenas desenvolvedores e testadores são os primeiros a receber a versão 2.0, enquanto outros usuários do Gemini têm acesso ao modelo experimental Flash 2.0, que é baseado na versão 1.5 Flash, lançada como o modelo mais rápido e econômico.

O Google anunciou uma série de novos recursos

Segundo a empresa, a expectativa é adicionar os recursos de raciocínio do novo modelo à funcionalidade Visão Geral de IA, que já está acessível a um bilhão de usuários, de acordo com Pichai. Ele indicou que essa funcionalidade está se tornando uma das mais populares do grupo.

Com esse novo modelo, Pichai destacou ainda que o AI Overviews agora será capaz de lidar com consultas complexas de várias etapas, como, por exemplo, equaçõesmatice perguntas multimodais.

Embora os testes limitados do modelo mais recente tenham começado esta semana, o recurso de raciocínio só estará disponível para mais usuários no início do próximo ano.

Segundo o Google, o modelo de raciocínio é executado no chip de IA de ^6ª geração da gigante das buscas , o Trillium, que também ficou disponível para os clientes do Google Cloud na quarta-feira.

Em sua postagem, o Google revelou que o novo chip oferece desempenho 4 vezes melhor e é 67% mais eficiente em termos de energia do que seu antecessor.

Estamos dando início à era Gemini 2.0 com o Gemini 2.0 Flash, que supera o 1.5 Pro em benchmarks importantes com o dobro da velocidade (veja o gráfico abaixo). Estou particularmente entusiasmado com o rápido progresso na programação, e muito mais está por vir.

Os desenvolvedores podem experimentar uma versão experimental em IA… pic.twitter.com/iEAV8dzkaW

-Sundar Pichai (@sundarpichai) 11 de dezembro de 2024

O CEO do Google também anunciou outros recursos, como o novo recurso do Gemini conhecido como Deep Research, que pode funcionar como um assistente de pesquisa usando raciocínio avançado e recursos de contexto extenso. Esse novo recurso está disponível no Gemini Advanced e é capaz de compilar relatórios de pesquisa em nome do usuário.

Hassabis afirmou que o Gemini 2.0 estava lançando as bases para um excelente ano de 2025.

“Consideramos 2025 como o verdadeiro início da era baseada em agentes.”

Hassabis.

Isso ocorre no mesmo dia em que a empresa anunciou o lançamento de outro produto, o Project Mariner, uma nova extensão experimental para o Chrome que pode literalmente usar um navegador da web para os usuários.

Além disso, o Google também anunciou o Jules – um agente criado especificamente para ajudar desenvolvedores a encontrar e corrigir códigos defeituosos – e um novo agente baseado no Gemini 2.0 que pode analisar as telas dos usuários e ajudá-los a jogar videogames melhor.

Segundo Hassabis, o agente do jogo, que ele chama de "easter egg", indica que ele é verdadeiramente multimodal.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Google

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Enacy Mapakame

Enacy Mapakame é jornalista com mais de 10 anos de experiência em notícias de negócios e finanças. Ela cobre mercados de capitais e tecnologias emergentes – o metaverso, IA e criptomoedas. Enacy é formada em Estudos de Mídia e Sociedade (BSc) com honras.

ÍNDICE

1. O Google implementará o modelo em todos os seus produtos

2. O Google anunciou uma série de novos recursos

Compartilhe este artigo