O Google adia o lançamento do Gemini, modelo de IA de última geração, para 2024 devido a problemas com comandos em idiomas diferentes do inglês

-
- O Google adiou o lançamento do modelo de IA Gemini para o início de 2024 devido a problemas com comandos de voz em idiomas que não o inglês.
-
- Gemini é aclamado como um divisor de águas por suas capacidades multimodais e geração de imagens.
-
- O potencial do Gemini para superar o GPT-4 e se comunicar por meio de imagens pode revolucionar as interações com IA.
Entusiastas de tecnologia e aficionados por IA terão que esperar um pouco mais pelo tão aguardado modelo de IA do Google, o Gemini, já que a empresa discretamente adiou seu lançamento para o início de 2024. O atraso, segundo fontes anônimas citadas pelo The Information, deve-se a dificuldades em lidar com solicitações e perguntas em idiomas que não sejam o inglês.
Uma inovação revolucionária em IA
Gemini gerou grande expectativa na indústria de tecnologia, pois promete ser um avanço revolucionário na inteligência artificial. Descrita como a próxima geração de IA, Gemini é multimodal, o que significa que pode processar vários tipos de dados e possui a notável capacidade de compreender e gerar texto, imagens e outros tipos de conteúdo com base em esboços ou descrições escritas. Essa versatilidade a diferencia dos modelos de IA anteriores, tornando-a uma potencial ferramenta de transformação.
Originalmente, o Google planejava apresentar o Gemini em eventos de lançamento agendados para as próximas semanas em Nova York, Washington e Califórnia. No entanto, esses eventos foram discretamente remarcados para o início de 2024. A decisão de adiar o lançamento teria surgido de preocupações de que o modelo de IA não estivesse apresentando o desempenho esperado ao lidar com solicitações e perguntas em idiomas que não o inglês, um aspecto crucial para garantir acessibilidade e funcionalidade globais.
Vantagem competitiva sobre o GPT-4
Apesar do atraso, o Gemini já chamou a atenção por suas capacidades excepcionais. Fontes sugerem que ele supera o GPT-4 da OpenAI, principalmente devido ao uso de um poder computacional significativamente maior. Sissie Hsiao, vice-presidente do Google e gerente do Bard e do Google Assistente, expressou seu entusiasmo com o potencial do Gemini. Ela mencionou que o modelo de IA pode gerar imagens exclusivas em resposta às solicitações do usuário, como fornecer imagens passo a passo para assar um cake, todas totalmente originais e não obtidas da internet. Essa capacidade de comunicação visual diferencia o Gemini de modelos de IA anteriores que se baseiam principalmente em texto.
Falar em imagens com humanos
Uma das características mais marcantes do Gemini é sua capacidade de conversar com humanos por meio de imagens, em vez de apenas texto. Por exemplo, se um usuário pedir para ele "desenhar três imagens das etapas para decorar um cakede três camadas", o Gemini pode criar essas imagens do zero. Essas imagens não são apenas inovadoras, mas também totalmente originais, demonstrando a capacidade criativa da IA. Essa inovação abre possibilidades empolgantes para uma ampla gama de aplicações, desde a criação de conteúdo até a resolução de problemas.
O Google já possui seu próprio modelo de IA generativa, chamado Bard, mas é o ChatGPT que tem enjde maior reconhecimento do consumidor até o momento. Com o lançamento iminente do Gemini, analistas especulam que o cenário pode mudar, potencialmente posicionando o Google como um player de destaque no campo da IA. A capacidade do Gemini de gerar texto e imagens de forma integrada pode revolucionar a maneira como interagimos com sistemas e aplicativos baseados em IA.
Implicações futuras do Gemini
O atraso no lançamento do Gemini demonstra o compromisso do Google em garantir que este modelo de IA de última geração esteja à altura das grandes expectativas criadas. Ao abordar questões relacionadas a comandos e perguntas em idiomas diferentes do inglês, o Google visa criar um sistema de IA robusto e confiável para usuários em todo o mundo. Quando o Gemini for finalmente lançado, poderá abrir portas para uma ampla gama de aplicações em diversos setores, incluindo criação de conteúdo, automação e resolução de problemas. Sua capacidade de compreender e gerar texto e imagens com base nas entradas do usuário tem o potencial de remodelar a forma como interagimos com a IA, tornando-a mais intuitiva e fácil de usar.
A decisão do Google de adiar o lançamento do Gemini para o início de 2024 pode decepcionar os entusiastas ansiosos, mas reflete a dedicação da empresa em fornecer um modelo de IA de alta qualidade que possa ter um desempenho consistente em diferentes idiomas e com diversas entradas de usuários. Os recursos multimodais do Gemini, a capacidade de se comunicar por meio de imagens e a promessa de superar os modelos de IA existentes fazem dele um desenvolvimento muito aguardado no mundo da inteligência artificial. Enquanto aguardamos ansiosamente o seu lançamento, resta saber como o Gemini impactará vários setores e mudará a forma como interagimos com as tecnologias baseadas em IA.
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Glória Kaburu
Glory é uma jornalista extremamente experiente e proficiente em ferramentas e pesquisas de IA. Ela é apaixonada por IA e escreveu diversos artigos sobre o assunto. Mantém-se atualizada sobre os últimos desenvolvimentos em Inteligência Artificial, Aprendizado de Máquina e Aprendizado Profundo, escrevendo sobre eles regularmente.
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














