NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Google veröffentlicht KI-Tool, das Bilder aus anderen Bildern erstellt

VonJai HamidJai Hamid
2 Minuten Lesezeit
Grafik mit Googles Logo und Galerie-Symbolen
  • Google hat Whisk auf den Markt gebracht, ein neues KI-Tool, das Bilder erstellt, indem es andere Bilder als Vorlage verwendet, anstatt sich auf Textbeschreibungen zu stützen.
  • Whisk wurde als Werkzeug vorgestellt, mit dem Nutzer Bilder kombinieren können, um Motiv, Stil und Szene defi. Whisk füllt sogar automatisch Eingabeaufforderungen aus, falls keine Bilder vorhanden sind.
  • Es basiert auf Googles Imagen 3-Modell, das angeblich die KI antreibt, um schnellere und qualitativ hochwertigere Ergebnisse zu liefern, obwohl es nicht perfekt ist.

Google hat Whisk vorgestellt, ein neues KI-Tool, das anhand von Bildern als Vorlage Bilder generiert. Im Gegensatz zu älteren Tools, die stark auf lange, detaillierte Textbeschreibungen angewiesen sind, ermöglicht Whisk Nutzern , Bilder hochzuladen, um defiThema, Szene und Stil des gewünschten Bildes festzulegen

Das Tool unterstützt zudem mehrere Bilder für jede dieser Eingaben und bietet Nutzern so viel Flexibilität zum Experimentieren. Falls Sie kein passendes Bild haben, stellt Google ein Würfelsymbol bereit, das die Eingabeaufforderungen automatisch mit Bildern ausfüllt.

Diese Platzhalterbilder scheinen jedoch ebenfalls KI-generiert zu sein. Nutzer können zudem etwas Text hinzufügen, um die Ausgabe genauer anzupassen; das Textfeld ist aber optional. Laut Hersteller liefert Whisk auch ohne Textfeld Ergebnisse.

Das Tool generiert anschließend ein Bild und den dazugehörigen Text, der bei der Erstellung verwendet wurde. Gefällt Ihnen das Ergebnis, können Sie es als Favorit speichern oder herunterladen. Andernfalls können Sie es anpassen, indem Sie den zugrunde liegenden Text bearbeiten oder etwas ganz Neues generieren.

Imagen 3 ist die treibende Kraft hinter Googles Whisk AI

Laut Google ist Whisk für die „schnelle visuelle Erkundung, nicht für pixelgenaue Bearbeitungen“ konzipiert. Es ist zwar flexibel und macht Spaß, liefert aber nicht immer perfekte Ergebnisse. Das Unternehmen räumt ein, dass das Tool „nicht immer präzise“ sein kann, weshalb schnelle Korrekturen für eine höhere Genauigkeit möglich sind.

Whisk nutzt Googles neuestes Bildgenerierungsmodell Imagen 3, das das Unternehmen ebenfalls zusammen mit dem Tool vorgestellt hat. Imagen 3 ermöglicht Whisk die Erzeugung der KI-generierten Ergebnisse, und die zugrundeliegende Technologie soll die Gesamtqualität der Ergebnisse verbessern.

Neben Imagen 3 stellte Google auch Veo 2 vor, sein verbessertes Videogenerierungsmodell. Veo 2 soll eine bessere Kinematografie ermöglichen und häufige Probleme wie verzerrte Darstellungen – beispielsweise den classic KI-Fehler zusätzlicher Finger – beheben.

Das Modell startet zunächst auf Googles VideoFX-Plattform, die sich derzeit noch in der Testphase über Google Labs befindet. Laut Unternehmen soll Veo 2 im Laufe des Jahres 2025 auch auf YouTube Shorts und anderen Google-Produkten verfügbar sein.

Aktuell positioniert das Unternehmen Whisk eher als Erkundungswerkzeug denn als professionelle Bearbeitungslösung. Ob es sich gegen Konkurrenten wie OpenAIs DALL-E behaupten kann, bleibt abzuwarten.

Wenn Sie einen ruhigeren Einstieg in die DeFi Kryptowährungen ohne den üblichen Hype wünschen, beginnen Sie mit diesem kostenlosen Video.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren

MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS