NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Was kann GPT-4o von OpenAI leisten?

VonIbiam WayasIbiam Wayas
Lesezeit: 2 Minuten
Was kann GPT-4o von OpenAI leisten?
  • Das neueste Modell von OpenAI, ChatGPT-4o, „fühlt sich an wie KI aus einem Film“
  • Es kann Anfragen in beliebiger Kombination aus Text-, Audio- und Bildanfragen annehmen und beantworten.
  • Es reagiert mit einer einfühlsameren Stimme als ein typisches KI-Modell.

OpenAI hat am Montag sein neuestes Flaggschiffmodell namens GPT-4o („o“ für „omni“) vorgestellt, und es scheint, als wären wir damit dem intelligenten Assistenten „Jarvis“ aus dem Film Iron Man so nah wie nie zuvor. 

Der entscheidende Vorteil von ChatGPT-4o liegt darin, dass es verschiedene Modalitäten verarbeiten kann, was die meisten bestehenden KI-Modelle nicht leisten. Das bedeutet, dass GPT-4o beliebige Kombinationen aus Text-, Audio- und Bildanfragen entgegennehmen und generieren kann.

Die vom Team auf X (ehemals Twitter) präsentierte Demo war so beeindruckend, dass sie von vielen hochgelobt wurde. Eine der größten Leistungen ist, dass GPT-4o in nur 232 Millisekunden auf Audioeingaben reagiert, was der menschlichen Reaktionszeit im Gespräch ähnelt.

„Es fühlt sich an wie KI aus einem Film; und es überrascht mich immer noch ein wenig, dass es Realität ist“, schrieb Sam Altman, CEO von OpenAI, am Montag in einem Blogbeitrag. „Menschliche Reaktionszeiten und Ausdrucksfähigkeit zu erreichen, ist eine große Veränderung.“

OpenAI hat damit begonnen, die Text- und Bildfunktionen von GPT-4o für Nutzer bereitzustellen. In den kommenden Wochen sollen die Audio- und Videofunktionen für eine kleine Gruppe vertrauenswürdiger API-Partner freigegeben werden, so das Unternehmen. 

Trotzdem gibt es einige Dinge, die Sie mit dem ChatGPT-4o-Modell machen können. 

Was Sie mit GPT-4o machen können

Bilder mit lesbaren Texten erstellen

Bislang hatten einige KI-Bildgeneratoren wie Midjourney noch Schwierigkeiten, Bilder mit lesbarem Text zu erzeugen. OpenAI gab jedoch bekannt, dass GPT-4o Textbeschreibungen nun deutlich besser versteht und lesbaren Text auf Bildern darstellen kann. 

Bildquelle: OpenAI

Echtzeitübersetzung

Wenn ein Übersetzer benötigt wird, kann GPT-4o diese Rolle übernehmen. In einer Videodemonstration zeigte das Team von OpenAI, dass GPT-4o etwas, das auf Englisch gesagt wurde, auf Spanisch und möglicherweise auch in anderen Sprachen wiederholen und anschließend wieder von Spanisch nach Englisch übersetzen kann.

Schauen und erzählen

Für Menschen mit Sehbehinderung oder einfach nur zum Spaß kann ChatGPT-4o mithilfe der Handykamera die Umgebung erfassen und beschreiben. In einem Fall erkannte das Gerät beispielsweise, dass jemand eine Geburtstagsfeier hatte, als es einen cake und eine Kerze im Raum bemerkte.

Mathematische Probleme lösen

Der GPT-4o kann mathematische Aufgaben auf einem Blatt Papier oder einem Bildschirm analysieren und die Lösungen anzeigen. Darüber hinaus kann er Sie auch anleiten und Ihnen helfen, die Aufgaben selbst zu lösen.

KI in visuellen Meetings

GPT-4o kann an Videokonferenzen teilnehmen und Gespräche mit den Teilnehmern führen. Es kann Nutzern auch bei der Vorbereitung auf Vorstellungsgespräche helfen. 

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren

Diesen Artikel teilen
MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS