Mark Zuckerberg relance Meta dans la bataille de l'IA avec Mango, un nouveau modèle d'image et de vidéo qui côtoie le prochain modèle de texte de Meta, Avocado, tous conçus pour rivaliser avec les nouveaux outils Gemini de Google et les systèmes d'images d'OpenAI.
Meta souhaite disposer des deux modèles au cours du premier semestre 2026, selon Alexandr Wang, le responsable de l'IA de l'entreprise, lors d'une séance de questions-réponses interne avec Chris Cox.
Alexandr a également indiqué que Meta commençait à travailler sur des modèles du monde préliminaires, c'est-à-dire des systèmes d'IA qui apprennent en intégrant des données visuelles de leur environnement.
Cet été, Meta a complètement remanié sa structure en matière d'IA. L'entreprise a recruté Alexandr pour diriger une division appelée Meta Superintelligence Labs. Zuckerberg s'est ensuite lancé dans une campagne de recrutement intensive, débauchant plus de vingt chercheurs d'OpenAI.
Il a constitué une équipe de plus de cinquante personnes possédant une expertise pointue en intelligence artificielle. Meta cherche à recruter massivement des spécialistes car la génération d'images est devenue un enjeu majeur pour les grandes entreprises de modélisation.
Les modèles de Google et d'OpenAI seront difficiles à concurrencer.
En septembre, Meta a lancé Vibes, un générateur vidéo développé avec Midjourney. Quelques jours plus tard, OpenAI a déployé son propre produit, Sora, pour rester compétitif. Ces échanges successifs ont démontré la rapidité de réaction de chaque entreprise.
Google avait déjà lancé une nouvelle offensive plus tôt dans l'année avec Nano Banana, faisant passer le nombre d'utilisateurs mensuels de Gemini de 450 millions en juillet à plus de 650 millions fin octobre. Cette hausse a accentué la pression sur les autres acteurs du marché.
La tension est remontée en novembre lorsque Google a lancé la troisième version de Gemini. Juste après, des sources internes à OpenAI ont indiqué que Sam Altman avait déclenché une alerte rouge pour inciter l'entreprise à reconquérir les premières places aux tests de modèles. OpenAI a ensuite publié une nouvelle version de ChatGPT Images.
Sam a ensuite rencontré des journalistes et a déclaré que la création d'images était désormais l'une des principales raisons pour lesquelles les utilisateurs reviennent vers les applications d'IA, la qualifiant de fonctionnalité « attachante ». Le message était clair : la bataille des images ne faiblit pas.
Google a annoncé mercredi la sortie de Gemini 3 Flash. Ce modèle, plus rapide et moins coûteux, est destiné à un large public. Il intègre de nombreuses capacités de traitement du signal de Gemini 3 Pro, dans un format plus compact.
Le plan est simple. Au lieu de réserver les meilleurs outils aux seules entreprises, Google souhaite les intégrer aux applications grand public.
Sundar Pichai, PDG d'Alphabet, a déclaré : « Avec cette mise à jour, l'intelligence nouvelle génération de Gemini 3 est désormais disponible pour tous les utilisateurs de nos produits, notamment l'application Gemini et le mode IA dans la recherche. Les développeurs peuvent l'utiliser avec l'API Gemini, Google AI Studio, l'interface de ligne de commande Gemini et Google Antigravity, tandis que les entreprises peuvent y accéder via Vertex AI et Gemini Enterprise. »

