- Das neueste Modell von OpenAI, ChatGPT-4o, „fühlt sich an wie KI aus einem Film“
- Es kann Anfragen in beliebiger Kombination aus Text-, Audio- und Bildanfragen annehmen und beantworten.
- Es reagiert mit einer einfühlsameren Stimme als ein typisches KI-Modell.
OpenAI hat am Montag sein neuestes Flaggschiffmodell namens GPT-4o („o“ für „omni“) vorgestellt, und es scheint, als wären wir damit dem intelligenten Assistenten „Jarvis“ aus dem Film Iron Man so nah wie nie zuvor.
Der entscheidende Vorteil von ChatGPT-4o liegt darin, dass es verschiedene Modalitäten verarbeiten kann, was die meisten bestehenden KI-Modelle nicht leisten. Das bedeutet, dass GPT-4o beliebige Kombinationen aus Text-, Audio- und Bildanfragen entgegennehmen und generieren kann.
Die vom Team auf X (ehemals Twitter) präsentierte Demo war so beeindruckend, dass sie von vielen hochgelobt wurde. Eine der größten Leistungen ist, dass GPT-4o in nur 232 Millisekunden auf Audioeingaben reagiert, was der menschlichen Reaktionszeit im Gespräch ähnelt.
„Es fühlt sich an wie KI aus einem Film; und es überrascht mich immer noch ein wenig, dass es Realität ist“, schrieb Sam Altman, CEO von OpenAI, am Montag in einem Blogbeitrag. „Menschliche Reaktionszeiten und Ausdrucksfähigkeit zu erreichen, ist eine große Veränderung.“
OpenAI hat damit begonnen, die Text- und Bildfunktionen von GPT-4o für Nutzer bereitzustellen. In den kommenden Wochen sollen die Audio- und Videofunktionen für eine kleine Gruppe vertrauenswürdiger API-Partner freigegeben werden, so das Unternehmen.
Trotzdem gibt es einige Dinge, die Sie mit dem ChatGPT-4o-Modell machen können.
Was Sie mit GPT-4o machen können
Bilder mit lesbaren Texten erstellen
Bislang hatten einige KI-Bildgeneratoren wie Midjourney noch Schwierigkeiten, Bilder mit lesbarem Text zu erzeugen. OpenAI gab jedoch bekannt, dass GPT-4o Textbeschreibungen nun deutlich besser versteht und lesbaren Text auf Bildern darstellen kann.

Echtzeitübersetzung
Wenn ein Übersetzer benötigt wird, kann GPT-4o diese Rolle übernehmen. In einer Videodemonstration zeigte das Team von OpenAI, dass GPT-4o etwas, das auf Englisch gesagt wurde, auf Spanisch und möglicherweise auch in anderen Sprachen wiederholen und anschließend wieder von Spanisch nach Englisch übersetzen kann.
Schauen und erzählen
Für Menschen mit Sehbehinderung oder einfach nur zum Spaß kann ChatGPT-4o mithilfe der Handykamera die Umgebung erfassen und beschreiben. In einem Fall erkannte das Gerät beispielsweise, dass jemand eine Geburtstagsfeier hatte, als es einen cake und eine Kerze im Raum bemerkte.
Mathematische Probleme lösen
Der GPT-4o kann mathematische Aufgaben auf einem Blatt Papier oder einem Bildschirm analysieren und die Lösungen anzeigen. Darüber hinaus kann er Sie auch anleiten und Ihnen helfen, die Aufgaben selbst zu lösen.
KI in visuellen Meetings
GPT-4o kann an Videokonferenzen teilnehmen und Gespräche mit den Teilnehmern führen. Es kann Nutzern auch bei der Vorbereitung auf Vorstellungsgespräche helfen.
Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.
Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)
















