Google hat seine sprachgesteuerte KI-Chatbot-Funktion Gemini Live allen Android-Nutzern kostenlos zur Verfügung gestellt. Die Funktion, die es den Benutzern ermöglicht, über Sprachbefehle mit dem KI-Chatbot von Google zu sprechen, war zuvor vollständig für Gemini Advanced-Abonnenten verfügbar.
Mit der neuen Funktion können alle Android-Nutzer die Dialogfunktionen des Chatbots nutzen, zu denen nun auch das Stellen von Fragen per Spracheingabe und das Unterbrechen von Antworten gehören.
Diese Ankündigung erfolgt nach dem ersten Start der Gemini Live-Anwendung letzten Monat bei Googles Pixel 9-Event. Android-Benutzer können die Funktion jetzt ganz einfach direkt aktivieren, indem sie in der Gemini-Anwendung auf ein Wellenformsymbol klicken, wodurch sie Sprachinteraktionen mit der KI verwenden können. Die Einführung erfolgt zu einem Zeitpunkt, an dem die Konkurrenzfunktion von Open AI, der Advanced Voice Mode für ChatGPT, noch nicht vollständig eingeführt wurde.
Benutzer können jetzt mit mehr Kontrolle auf den Sprachmodus von Gemini zugreifen
Zu den bemerkenswertesten Funktionen von Gemini Live gehört die Möglichkeit für Benutzer, Fragen laut zu stellen, Antworten mitten im Satz zu unterbrechen und verschiedene Stimmen für die Antworten der KI auszuwählen. Diese Freisprechfunktion sorgt für ein gewisses Maß an Flexibilität und Personalisierung und macht Gespräche mit KI flüssiger und reaktionsschneller. Neben der Verwaltung der Diskussion in Echtzeit können die Teilnehmer bei Bedarf auch jederzeit die Antworten „halten“ oder die Konversation „beenden“.
Obwohl die Sprachsteuerung zunächst eine Funktion eines kostenpflichtigen Dienstes war, ist diese sprachgesteuerte Funktion jetzt in der kostenlosen Version der Gemini-Anwendung verfügbar. Android-Benutzer können die App oder das Overlay verwenden, um sofort darauf zuzugreifen. Derzeit ist der Sprachmodus nur für die Unterstützung der englischen Sprache optimiert. Google hat jedoch Pläne bestätigt, weitere Sprachen hinzuzufügen und diese Funktion auch auf iOS-Geräten verfügbar zu machen, obwohl kein genauer Zeitplan angegeben wurde.
Google führt Gemini Live ein, da die Sprachfunktion von OpenAI hinterherhinkt
Mit dem Zeitpunkt dieser Einführung liegt Google vor OpenAI, das im Mai seinen Advanced Voice Mode für ChatGPT bekannt gab. Diese von Open AI angebotene Funktion wurde jedoch noch nicht allgemein verfügbar gemacht, da sie seit Ende Juli nur begrenzt verfügbar ist. Andere Brancheninsider vermuteten außerdem, dass die lange Wartezeit möglicherweise auf die hohe Rechenleistung zurückzuführen sei, die zur Unterstützung sprachbasierter KI-Interaktionen, insbesondere in großem Maßstab, erforderlich sei.
Der Schritt von Google, Gemini Live kostenlos zu starten, steht im Gegensatz zur gestaffelten Veröffentlichung einer ähnlichen Funktion durch OpenAI. Während OpenAI weiterhin eine Strategie für eine breitere Akzeptanz entwickelt, gibt die Veröffentlichung von Google Gemini Live in die Hände der Benutzer, die gerne mit KI durch Sprechen statt durch Tippen interagieren möchten, was einen Wettbewerbsvorteil zwischen den beiden Unternehmen darstellt.
Derzeit ist Gemini Live auf Android-Geräten verfügbar und Google plant, im Zuge der Weiterentwicklung des Dienstes weitere Funktionen hinzuzufügen.