A competição em inteligência artificial entre o Google e a OpenAI se intensificou em apenas dois meses de 2024. Em 15 de fevereiro, a OpenAI anunciou o Sora, indiscutivelmente o melhor gerador de vídeo com IA já desenvolvido. Na quarta-feira, o Google lançou um novo produto inovador chamado Gemma.
Gemma não é, na verdade, um produto único, mas sim uma família de dois grandes modelos de linguagem. Nas palavras do próprio Google: "Gemma é uma família de modelos leves e abertos, construída a partir da pesquisa e da tecnologia que o Google usou para criar os modelos Gemini."
Segundo o anúncio, Gemma já está disponível para desenvolvedores do mundo todo. Os modelos podem ser usados para desenvolver diversas ferramentas, como chatbots e praticamente tudo o que os modelos de aprendizagem de linguagem (LLMs) podem fazer, mas com algumas vantagens exclusivas.
Aqui estão alguns detalhes que você precisa saber sobre Gemma.
1. Gemma Modelos Abertos
Gemma é o primeiro modelo importante do Google criado para a comunidade aberta de desenvolvedores e pesquisadores. O Google tem mantido, em sua maioria, uma abordagem de acesso fechado com seus produtos de IA, incluindo o Gemini, que é o modelo mais avançado da empresa e que alimenta alguns de seus produtos, como o Bard (agora chamado Gemini).
A abordagem fechada do Google atraiu críticas de defensores do código aberto, como Yann LeCun, cientista-chefe da Meta, que argumentou que a DeepMind, divisão de desenvolvimento de IA do Google, está "se tornando cada vez menos aberta. [...] Acho que isso vai desacelerar o progresso em toda a área. Então, não estou nada feliz com isso."
Não que o código-fonte ou os dados de treinamento de Gemma estarão disponíveis para acesso público como um "modelo aberto", mas os "pesos" do modelo, ou parâmetros pré-treinados, serão disponibilizados, informou a Forbes, citando a porta-voz do Google, Jane Park.
2. O modelo Gemma está disponível em dois tamanhos
Gemma está disponível em duas versões de peso: Gemma 2B e Gemma 7B. Conforme anunciado, cada tamanho é lançado com variantes pré-treinadas e ajustadas por instruções. Os parâmetros representam as conexões e os pesos dentro do modelo que permitem capturar nuances e relações nos dados.
Quanto maior o número de parâmetros que um modelo possui, melhor ele consegue aprender padrões complexos e executar tarefas intrincadas, como traduzir idiomas, escrever diferentes tipos de textos criativos ou compreender perguntas complexas.
3. Gemma é compatível com laptops
Gemma, embora seja um modelo de linguagem poderoso, foi especificamente projetado para ser eficiente e funcionar em ambientes menos exigentes em comparação com outros grandes modelos de linguagem. O Google afirmou que o modelo é compatível com diversas plataformas e pode ser executado em vários dispositivos, como laptops, desktops, IoT, dispositivos móveis e nuvem, possibilitando recursos de IA amplamente acessíveis.
“Os modelos Gemma pré-treinados e ajustados por instruções podem ser executados em seu laptop, estação de trabalho ou Google Cloud, com fácil implantação no Vertex AI e no Google Kubernetes Engine (GKE)”, diz o anúncio.

