Google a annoncé qu'il déploient les capacités d'IA en temps réel de Gemini, ce qui permettra au système d'IA d'analyser instantanément les écrans de smartphone et les flux de caméras. Ces fonctionnalités seront accessibles pour sélectionner les abonnés de Google One AI Premium.
La nouvelle fonctionnalité a suivi la première démonstration «Project Astra» de Google il y a près d'un an, apportant des capacités de caméra et de partage d'écran alimentées à Gemini Live. Google a révélé que la nouvelle fonctionnalité vidéo en direct permettrait aux Gémeaux interpréter le flux des caméras de smartphone des utilisateurs en temps réel et répondent aux questions.
La société technologique a publié une vidéo plus tôt ce mois-ci démontrant l'utilisation de la fonction vidéo en direct de Gemini pour choisir une couleur de peinture pour la poterie fraîchement vitrée.
Google déploie les fonctionnalités vidéo de l'IA en temps réel de Gemini
La nouvelle fonctionnalité permettrait également aux utilisateurs d'avoir une conversation de va-et-vient avec les Gémeaux en fonction du flux de l'écran en temps réel. Un utilisateur sur Reddit a accédé à l'écran «Partager avec Live» en appuyant sur le bouton au-dessus du champ de texte «Ask Gemini» sur la superposition Gemini.

L'utilisateur de Reddit a également publié une vidéo ci-dessous présentant la nouvelle capacité de lecture d'écran de Gemini. Il fait partie des deux fonctionnalités que la société technologique a déclaré qu'elle "commencerait à se déployer aux abonnés Gemini Advanced dans le cadre du plan Premium Google One AI" plus tard ce mois-ci. Les capacités de caméra en temps réel sont accessibles en ouvrant l'interface complète en direct Gemini et en démarrant un flux vidéo.
Google a soutenu que Gemini Live utiliserait une nouvelle notification de style appel téléphonique et une interface complète plus compacte, bien qu'elles n'aient pas encore été largement déployées. La société technologique a également reconnu en janvier que les propriétaires de Pixel (et Galaxy S25) seront «parmi les premiers à obtenir des capacités de projet Astra comme le partage d'écran et le streaming vidéo en direct».
Google déploie les fonctionnalités de la toile et de l'audio
aujourd'hui au @geminiapapp Tournez les documents, les diapositives + les rapports de recherche profonds en podcasts avec une vue d'ensemble audio. Ou créez un DOC ou un projet de codage avec Canvas - il fait tourner les prototypes super rapides et vous pouvez modifier avec Gemini en temps réel. pic.twitter.com/tedlzosqes
- Sundar Pichai (@sundarpichai) 18 mars 2025
Google a également publié une autre nouvelle fonctionnalité Gemini le 18 mars appelée «Canvas», qui permet aux utilisateurs affiner leurs documents et leurs code. L'entreprise a reconnu que les utilisateurs pouvaient sélectionner «Canvas» dans leur barre d'invite, où ils peuvent écrire et modifier des documents ou du code, avec des modifications apparaissant en temps réel.
La société technologique a souligné que Canvas rationalisera le processus de transformation des idées de codage en prototypes de travail pour les applications Web, les scripts Python, les jeux, les simulations et autres applications interactives. Google a également déclaré que la nouvelle fonctionnalité permettra aux utilisateurs de se concentrer sur la création, l'édition et le partage de leur code et leur conception en un seul endroit sans les tracas de basculer entre plusieurs applications. La société technologique a déployé la toile pour les abonnés Gemini et Gemini Advanced dans le monde dans toutes les langues.
Google a également introduit un aperçu de l'audio, qui transforme les documents, les diapositives des utilisateurs et même les rapports de recherche profonds en discussions de style podcast engageantes entre deux hôtes d'IA.
Cryptopolitan Academy: Vous voulez développer votre argent en 2025? Apprenez à le faire avec DeFi dans notre prochaine webclass. Enregistrez votre place