Le géant des moteurs de recherche Google a lancé mercredi son Gemini 2.0, un modèle expérimental capable d'utiliser des sites Web de manière autonome et qui est fondamentalement un modèle « pour tout ».
Selon Sundar Pichai, PDG de Google, le dernier modèle permettra aux utilisateurs de créer de nouveaux agents d’IA qui « nous rapprochent de notre vision d’un assistant universel ». La société a décrit son modèle comme étant le « modèle le plus performant jamais conçu pour l’ère agentique ».
Ces initiatives s'inscrivent dans le cadre des efforts de l'entreprise face à la concurrence accrue du secteur technologique contre des sociétés comme Meta, Microsoft et Meta.
Google déploiera le modèle sur tous les produits
Pichai a également révélé le dernier modèle, dont les capacités multimodales seront déployées dans tous ses produits, notamment la sortie d'image et audio native. Le géant des moteurs de recherche a lancé Gemini 1.0 en décembre de l'année dernière, qui, selon Google, était le premier modèle « nativement multimodal », suggérant que le modèle pourrait traiter et répondre aux requêtes de texte, de vidéo, d'image, d'audio et de code.
La dernière version représente les derniers efforts de Google dans la course de plus en plus compétitive à l'IA dans l'industrie technologique.
"Si Gemini 1.0 visait à organiser et à comprendre l'information, Gemini 2.0 vise à la rendre beaucoup plus utile."
Pichaï.
Gemini 2.0 arrive près de 10 mois après le premier lancement par Google de la version 1.5. Le modèle est toujours en avant-première expérimentale, selon Google, avec une seule version du modèle, la version Flash 2.0 plus petite et bas de gamme publiée.
Demis Hassabis, PDG de Google DeepMind et responsable des efforts d'IA de l'entreprise, a déclaré que c'était encore un grand jour pour le géant de la technologie.
«C'est aussi bon que le modèle Pro actuel. Vous pouvez donc le considérer comme un niveau supérieur, pour la même rentabilité, la même efficacité et la même vitesse. Nous en sommes vraiment satisfaits », a expliqué Hassabis.
Actuellement, seuls les développeurs et les testeurs sont les premiers à bénéficier de la version 2.0, tandis que les autres utilisateurs de Gemini ont accès au modèle expérimental Flash 2.0, qui s'appuie sur la version 1.5 Flash, qui a été lancée comme le modèle le plus rapide et le plus rentable.
Google a annoncé une série de nouvelles fonctionnalités
Selon la société, elle prévoit d'ajouter les capacités de raisonnement du nouveau modèle à la fonctionnalité AI Overviews qui est désormais accessible à un milliard d'utilisateurs, selon Pichai. Il a indiqué qu'il est en train de devenir l'une des fonctionnalités de recherche les plus populaires du groupe.
Avec ce nouveau modèle, Pichai a en outre souligné que les aperçus de l'IA seront désormais capables de traiter des requêtes complexes en plusieurs étapes, par exemple des équationsmaticet des questions multimodales.
Bien que des tests limités pour le modèle le plus récent aient commencé cette semaine, la fonction de raisonnement ne sera accessible à un plus grand nombre d'utilisateurs qu'au début de l'année prochaine.
Selon Google, le modèle de raisonnement fonctionne à partir de la puce d'IA de 6e génération du géant des moteurs de recherche , Trillium, qui est également devenue disponible mercredi pour les clients de Google Cloud.
Dans son article , Google a révélé que la nouvelle puce offre des performances 4 fois supérieures et est 67 % plus économe en énergie que son prédécesseur.
Nous lançons le début de notre ère Gemini 2.0 avec Gemini 2.0 Flash, qui surpasse 1,5 Pro sur les tests clés à une vitesse 2X (voir le tableau ci-dessous). Je suis particulièrement excité de voir les progrès rapides en matière de codage, et d'autres sont à venir.
Les développeurs peuvent essayer une version expérimentale en IA… pic.twitter.com/iEAV8dzkaW
– Sundar Pichai (@sundarpichai) 11 décembre 2024
Le PDG de Google a également annoncé d'autres fonctionnalités, telles que la nouvelle fonctionnalité Gemini connue sous le nom de Deep Research, qui peut servir d'assistant de recherche en utilisant un raisonnement avancé et des capacités de contexte long. Cette nouvelle fonctionnalité est disponible dans Gemini Advanced et est capable de compiler des rapports de recherche pour le compte d'un utilisateur.
Hassabis a déclaré que Gemini 2.0 jetait les bases d'une grande année 2025.
« Nous considérons vraiment 2025 comme le véritable début de l’ère des agents. »
Hassabis.
Cela survient alors que la société a annoncé le lancement d'un autre produit, Project Mariner , une nouvelle extension Chrome expérimentale qui peut littéralement utiliser un navigateur Web pour les utilisateurs.
De plus, Google a également annoncé Jules – un agent créé spécifiquement pour aider les développeurs à trouver et corriger les mauvais codes – et un nouvel agent basé sur Gemini 2.0 qui peut examiner les écrans des utilisateurs et les aider à mieux jouer aux jeux vidéo.
Selon Hassabis, l'agent de jeu qu'il appelle un « œuf de Pâques » souligne qu'il est véritablement multimodal.
Cryptopolitan Academy: Vous voulez développer votre argent en 2025? Apprenez à le faire avec DeFi dans notre prochaine webclass. Enregistrez votre place