O Baidu está buscando o mercado de óculos inteligentes com tecnologia de IA, enfrentando gigantes como Meta, Snap e outros.
Na terça-feira, durante um evento em Xangai, o chefe da marca de hardware Xiaodu do Baidu, Li Ying, explicou que os novos óculos inteligentes da empresa foram projetados para serem “um assistente particular”. Este movimento é uma tentativa séria de entrar no jogo de hardware de IA.
Então, o que exatamente os óculos de IA do Baidu podem fazer? Alimentados por seu grande modelo de linguagem, Ernie, esses óculos são configurados para realizar todos os tipos de tarefas. O Baidu afirma que os usuários poderão monitorar a ingestão de calorias, gravar vídeos, tocar música e até fazer perguntas aos óculos sobre o que está ao seu redor.
Pense em Siri ou Alexa, mas amarrado ao seu rosto. Mas aqui está o problema: esses óculos vão ficar na China, pelo menos por enquanto. A decisão do Baidu de mantê-los fora das prateleiras estrangeiras é um sinal claro de que está focado primeiro no mercado local, e talvez isso seja inteligente.
O plano de jogo do Baidu para a tecnologia chinesa
Com o carregamento do Baidu, o espaço dos óculos inteligentes de IA ficou ainda mais lotado. Até agora, este mercado era em grande parte um playground para startups que faziam experiências com óculos inteligentes. Não mais. Grandes nomes da tecnologia chinesa estão reivindicando sua posição.
Embora o Baidu tenha um longo caminho pela frente, está entrando na corrida num momento em que a demanda por produtos com infusão de IA está explodindo. Especialistas afirmam que as empresas tecnológicas chinesas estão a encontrar formas de colmatar a lacuna, embora possam estar atrás das empresas norte-americanas em termos de poder bruto dos seus modelos linguísticos.
Um cenário potencial é aproveitar a enorme indústriatronda China para produzir produtos de consumo acessíveis alimentados por IA. Os óculos inteligentes da Meta, desenvolvidos com a Ray-Ban, são vendidos por até US$ 379, mas não estão disponíveis na China. Isso significa que o Baidu tem a vantagem de jogar em casa e o momento não poderia ser melhor.
Com um lançamento inicial planejado para o próximo ano, ela está se posicionando para oferecer algo grande em um mercado que já está entusiasmado com a IA. Para o Baidu, este é apenas o projeto mais recente que coloca seu modelo de linguagem Ernie em destaque.
Ernie, recentemente renomeado como Wenxiaoyan no celular, já está incorporado em outros produtos Xiaodu, como seu painel virtual, uma ferramenta familiar para manter o controle sobre parentes idosos. Essa configuração permite que os usuários conversem com médicos com tecnologia de IA, definam lembretes de medicamentos e monitorem o bem-estar geral sem a necessidade de um smartphone. Numa sociedade em envelhecimento, esta é uma aplicação óbvia.
O Baidu não é o único a apostar em gadgets alimentados por IA. ByteDance, empresa controladora da TikTok, lançou seus próprios fones de ouvido de IA, que permitem aos usuários interagir com seu chatbot, Doubao, totalmente com as mãos livres.
Gigantes da IA se enfrentam
O Baidu tem outro produto de IA em desenvolvimento: um novo gerador de imagens chamado iRAG. O CEO do Baidu, Robin Li, deixou claro que o iRAG não é um gerador de imagens comum. Usando a geração aumentada de recuperação (RAG), a ferramenta reduz as alucinações – aquelas estranhas imprecisões que a IA às vezes cospe.
Li estádent sobre isso: “A maior mudança na IA no último ano foi a redução das alucinações, e o RAG é o que torna isso possível.” Ao extrair informações precisas de fontes externas, o iRAG é a tentativa do Baidu de aumentar a confiabilidade, algo contra o qual as ferramentas alimentadas por IA têm lutado.
Enquanto isso, Tencent e Alibaba viram suas ações dispararem este ano. Do Baidu? Nem tanto. As ações do Baidu caíram 26% desde janeiro. Por que? Os investidores estão frustrados com seus esforços de IA e preocupados com o declínio da receita publicitária.
A principal fonte cash do Baidu é a publicidade em seu mecanismo de busca, e se isso começar a vacilar, será um problema. A empresa precisa que estes projetos de IA funcionem, não apenas por uma questão de inovação, mas para manter o seu modelo de negócio em funcionamento.
Do outro lado do Pacífico, Meta também não está descansando. Na quarta-feira passada, o CEO Mark Zuckerberg apresentou o mais novo protótipo da Meta, Orion, em sua conferência anual Connect. Zuckerberg não hesitou em exaltar a nova tecnologia, chamando-a de “a mais avançada” do mundo.
Orion possui displays holográficos que combinam conteúdo 2D e 3D com o mundo real. Ele também usa IA para analisar tudo o que está na frente do usuário.
As ações da Meta subiram 2% após o anúncio, mostrando que os investidores gostaram do que ouviram. Mas não espere colocar as mãos no Orion tão cedo; esta tecnologia é estritamente para uso interno e para alguns desenvolvedores sortudos.
Meta não está satisfeita apenas com óculos AR; agora busca um dispositivo que algum dia possa substituir o smartphone. É por isso que está investindo recursos em algo chamado eletromiografia (EMG). Essa tecnologia usa sensores de pulso para transformar sinais nervosos em comandos, o que significa que um dia você poderá controlar dispositivos com um pensamento.
Em 2019, a Meta adquiriu a CTRL-labs, uma startup focada em EMG, por US$ 1 bilhão. Zuckerberg também compartilhou o que espera alcançar: “Às vezes a voz é muito pública; você precisa de uma maneira de enviar um sinal do seu cérebro diretamente para o dispositivo.”
O outro grande projeto de IA da Meta, o grande modelo de linguagem Llama, acaba de receber uma grande atualização. A versão 3.2 agora compreende tabelas, gráficos e documentos, adicionando um novo nível de versatilidade. Zuckerberg está promovendo o Llama como o “Linux da IA”, dizendo que ele poderia se tornar um padrão da indústria.
O chatbot AI, construído no Llama, agora tem 500 milhões de usuários ativos mensais. Para completar, a Meta lançou uma nova versão de seus óculos inteligentes Ray-Ban, que permite aos usuários analisar imagens, escanear códigos QR, traduzir conversas ao vivo e muito mais – sem exibição de AR, mas com bastante poder de fogo de IA.
Principais diferenças : os projetos de criptografia de ferramenta secreta usam para obter cobertura de mídia garantida