O CEO da DeepMind, do Google, também teria reconhecido a dificuldade que o Google enfrenta para manter sua proeminência na geração de tecnologias de vídeo, assim como a OpenAI Family, que vem demonstrando sucesso significativo no mercado nessa área. Essa declaração, porém, torna-se insuficiente se ambas as empresas continuarem avançando na humanização do conteúdo em vídeo, à medida que expandem os limites das capacidades da IA na criação de vídeos realistas a partir de instruções em texto.
O início da era dos vídeos gerados por IA
A OpenAI revelou recentemente o Sora, uma IA fascinante capaz de gerar automaticamente vídeos de até 60 segundos com cenas complexas e personagens. Em fevereiro, o Sora lançou vídeos de demonstração da extensão para Figma, que viralizaram, mostrando a capacidade de criar imagens com detalhes completos e dinâmicas, em vez de apenas texto sobre uma tela. Essa inteligência artificial é algo realmente inovador, apontando defipara a possibilidade de que, no futuro, a criação de conteúdo e a narrativa digital impulsionadas por IA evoluam a ponto de ocupar um lugar ao lado dos contadores de histórias humanos.
O Google vem desenvolvendo seu gerador multifuncional de texto para vídeo, apelidado de "Lumiere". O Lumiere foi apresentado em um artigo de pesquisa na edição de janeiro. Ele é capaz de gerar vídeos de cinco segundos e seria realmente impressionante dizer que, mesmo em vídeos de um minuto, o Lumiere é competente o suficiente para reproduzir tudo o que o Sora faz em vídeos complexos de um minuto. O Google destacou que a IA deve ser segura desde a sua concepção, o que inclui evitar o uso indevido, a promoção de mudanças climáticas ou a produção de conteúdo perigoso. Essa declaração sobre ética profissional veio à tona quando o Google adiou o lançamento de seu gerador de imagens de aprendizado profundo, o Gemini, após este gerar imagens que foram criticadas por perpetuarem imprecisões históricas.
O desafio dos dados e da ética no desenvolvimento da IA
Os desafios enfrentados pelo Google DeepMind e pelo OpenAI estão intrinsecamente ligados não apenas à qualidade de seus modelos de IA, mas também às limitações tecnológicas e à participação humana. Grande parte do problema reside na aquisição de dados necessária para treinar esses modelos em larga escala, e essa é a base para o avanço da tecnologia de IA.
Duas empresas se envolveram em um projeto conjunto e travaram algumas batalhas para obter os dados, que se tornaram parte do sistema de treinamento fatal para vídeos do YouTube. Mira Murati, CTO da OpenAI, afirmou em entrevista ao The Wall Street Journal que a natureza do treinamento do Sora era duvidosa. O modelo do Sora possivelmente carecia da funcionalidade de uma rede neural profunda que auxiliaria na compreensão de um conteúdo complexo como um vídeo.
Neal Mohan, o atual CEO do YouTube, refutou essas alegações, concentrando-se nas políticas que certamente seriam violadas por esse método, afirmando que essa abordagem infringiria os termos de uso do YouTube. Apesar dessas suposições, existem algumas recomendações sobre o uso de vídeos do YouTube para o desenvolvimento da ferramenta de reconhecimento de fala Whisper, o que adiciona questões ainda mais complexas relacionadas à utilização ética de dados no treinamento de IA.
A geração de vídeo por IA sob uma perspectiva diferente
As preocupações éticas relacionadas ao uso de dados e ao mau uso de tecnologias de IA sempre foram significativas para desenvolvedores e reguladores da área. A confiabilidade dos algoritmos para avaliar usos intencionalmente injustos e prevenir intenções maliciosas representa uma tendência mais ampla no setor de IA, que se preocupa com o desenvolvimento responsável da inteligência artificial. Emtrac, o rápido desenvolvimento de sistemas inteligentes, incluindo o Sora da OpenAI, traz complexidades à implementação desses códigos éticos.
O fato de o Google DeepMind e a OpenAI estarem em desacordo revela muito da mesma história de uma grande competição entre gigantes da tecnologia na inovação em IA. Embora a OpenAI tenha feito um trabalho bastante bom com o Sora até agora, o Google não só está produzindo o Lumiere, como também trabalhando no desenvolvimento de IA ética, o que demonstra que a questão da supremacia da IA está longe de terminar. A jornada rumo ao sucesso na criação de uma IA capaz de gerar vídeos cada vez mais complexos em termos de realismo e sofisticação exige agilidade da tecnologia, da ética e da criatividade.
A exploração industrial, por sua vez, será essencial, pois o equilíbrio entre inovação e responsabilidade será crucial. Empresas como Google DeepMind e OpenAI não estão apenas competindo para desenvolver a IA mais inovadora, mas também para estabelecer um paradigma ético que regerá o futuro do mundo da IA. O resultado dessa corrida provavelmente determinará o futuro de elementos vitais como mídia digital, criação de conteúdo e o papel da IA em nossas vidas, provocando ajustes nessas áreas nos próximos anos.

