Le PDG de DeepMind (Google) reconnaît également la difficulté pour Google de maintenir sa position dominante dans le développement de technologies vidéo, à l'instar d'OpenAI Family, qui connaît un succès considérable sur ce marché. Cette affirmation ne suffit plus si les deux entreprises continuent de progresser dans l'humanisation du contenu vidéo, repoussant sans cesse les limites de l'IA pour créer des vidéos réalistes à partir de commandes textuelles.
L'aube des vidéos générées par l'IA
OpenAI a récemment dévoilé Sora, une IA captivante capable de générer automatiquement des vidéos de 60 secondes maximum, avec des scènes complexes mettant en scène plusieurs personnages. En février, Sora a publié des vidéos de démonstration de son extension Figma, qui sont devenues virales, mettant en avant sa capacité à créer des plans riches en détails et dynamiques, et non plus seulement du texte sur une toile. Cette intelligence artificielle est véritablement novatrice et defientrevoir la possibilité, à l'avenir, que la création de contenu pilotée par l'IA et la narration numérique prennent une place de choix aux côtés des conteurs humains.
Google a développé Lumière, un générateur de texte en vidéo multifonctionnel. Lumière a été présenté dans un article de recherche paru dans le numéro de janvier. Capable de générer des vidéos de cinq secondes, Lumière pourrait, à une vitesse d'une minute, reproduire tout ce que fait Sora dans des vidéos complexes d'une minute. Google a insisté sur le fait que l'IA doit être sûre dès sa conception, ce qui exclut toute contribution au changement climatique, toute utilisation abusive ou la production de contenu dangereux. Cette prise de position éthique est intervenue lorsque Google a reporté le lancement de Gemini, son générateur d'images basé sur l'apprentissage profond, après que celui-ci ait généré des images critiquées pour leurs inexactitudes historiques persistantes.
Le défi des données et de l'éthique dans le développement de l'IA
Les défis posés par Google DeepMind et OpenAI dépendent non seulement de la qualité de leurs modèles d'IA, mais aussi des limitations technologiques et de l'intervention humaine. Une part importante du problème réside dans l'acquisition des données nécessaires à l'entraînement massif de ces modèles, et c'est ce qui permet de faire progresser la technologie de l'IA.
Deux entreprises étaient impliquées dans un projet commun et ont dû batailler pour obtenir les données qui ont servi à la mise au point du système d'entraînement défectueux utilisé dans les vidéos YouTube. Mira Murati, directrice technique d'OpenAI, a déclaré au Wall Street Journal que la qualité de l'entraînement de Sora était douteuse. Le modèle de Sora ne disposait probablement pas des fonctionnalités d'un réseau neuronal profond, pourtant essentiel à la compréhension d'un contenu complexe comme un extrait vidéo.
Neal Mohan, l'actuel PDG de YouTube, a réfuté ces affirmations en soulignant les violations que cette méthode enfreindrait, notamment les conditions d'utilisation de YouTube. Malgré ces constats, certaines recommandations concernant l'utilisation des vidéos YouTube pour le développement de l'outil de reconnaissance vocale Whisper soulèvent des questions éthiques supplémentaires quant à l'utilisation des données dans l'entraînement des IA.
La génération vidéo par IA sous un autre angle
Les questions éthiques liées à l'utilisation des données et au détournement des technologies d'IA ont toujours été au cœur des préoccupations des développeurs et des régulateurs. La fiabilité des algorithmes pour détecter les utilisations intentionnellement abusives et prévenir les actes malveillants témoigne d'une tendance plus large au sein du secteur de l'IA : le souci d'un développement responsable. Cependant, l'tracsuscité par le développement rapide des systèmes intelligents, comme Sora d'OpenAI, complexifie la mise en œuvre de ces principes éthiques.
Le désaccord entre Google DeepMind et OpenAI illustre bien la compétition acharnée qui oppose les géants de la tech en matière d'innovation dans l'IA. Si OpenAI a réalisé un travail remarquable avec Sora, Google, outre le développement de Lumière, travaille également sur une IA éthique, preuve que la question de la suprématie en IA est loin d'être réglée. La quête d'une IA capable de générer des vidéos toujours plus complexes et réalistes rend la technologie, l'éthique et la créativité extrêmement dynamiques.
L'exploration sectorielle sera essentielle, car un équilibre entre innovation et responsabilité sera crucial. Des entreprises comme Google DeepMind et OpenAI ne se contentent pas de rivaliser pour développer l'IA la plus innovante ; elles s'attachent également à définir un paradigme éthique qui régira l'avenir du monde de l'IA. L'issue de cette course déterminera probablement l'avenir d'éléments aussi vitaux que les médias numériques, la création de contenu ou le rôle de l'IA dans nos vies, et entraînera des ajustements dans ces domaines pour les années à venir.

