Stability AI bereitet sich auf die Veröffentlichung von Stable Diffusion 3 vor, der bisher fortschrittlichsten Version seines Bildgenerierungsmodells.
Das Startup gab am Donnerstag bekannt, dass es eine Warteliste für eine frühe Vorschau von Stable Diffusion 3 eröffnet hat. Laut Ankündigung ist die Vorschauphase wichtig, um Erkenntnisse zu gewinnen, die zur weiteren Verbesserung des Modells und möglicherweise zur Behebung von Fehlern und Problemen vor dem noch nicht bekannt gegebenen öffentlichen Veröffentlichungstermin beitragen.
Stable Diffusions Weg zu modernster KI-Kunst
Vor Stable Diffusion 3 gab es bei Stability etwa sieben Iterationen des Bildmodells, darunter 1.4, 1.5, 2.0, 2.1, XL und XL Turbo.
Im Vergleich zu beliebten und fortschrittlichen Bildgebungsmodellen wie DALL-E 3 und Midjourney schneidet Stable Diffusion 3, gemessen an einigen der auf der Website bereitgestellten Bildbeispiele, ähnlich gut, wenn nicht sogar besser ab.
Stability gab an, dass sein neuestes Modell deutlich verbessert wurde und nun Aufgaben mit mehreren Themen, Bildqualität und Rechtschreibfähigkeit wesentlich besser bewältigt. Systeme wie Midjourney haben hingegen weiterhin Schwierigkeiten, Wörter in Bildern korrekt zu buchstabieren.
Stable Diffusion 3 bietet mehrere Parametergrößen
Stable Diffusion 3 wird laut Ankündigung in verschiedenen Parametergrößen von 800 Millionen bis 8 Milliarden Parametern veröffentlicht. Die Parametergröße korreliert direkt mit der Modellkomplexität. Mehr Parameter bedeuten im Allgemeinen eine bessere Fähigkeit, komplexe Muster zu erfassen und bestimmte Aufgaben auszuführen.
Das KI-Startup erklärte, die Einführung verschiedener Parameter des Modells stehe „im Einklang mit unseren Kernwerten und demokratisiert den Zugang, indem den Nutzern eine Vielzahl von Optionen für Skalierbarkeit und Qualität geboten wird, um ihren kreativen Bedürfnissen bestmöglich gerecht zu werden.“
Die KI-Bildgeneratoren haben sich in den letzten Jahren stetig verbessert, die Grenzen des Machbaren erweitert und die Grenzen zwischen Realität und KI-generierten Bildern verwischt.
Während der rasante Fortschritt spannende Möglichkeiten eröffnet, wirft er auch wichtige Fragen hinsichtlich eines verantwortungsvollen Umgangs auf, die es zu klären gilt.
Stability legte bei Stable Diffusion 3 Wert auf „verantwortungsvolle KI-Praktiken“ und erklärte, dass im Vorfeld dieser frühen Vorschau zahlreiche Sicherheitsvorkehrungen getroffen wurden, um den Missbrauch des Modells durch böswillige Akteure zu verhindern.

