Alibabas neuestes KI-Modell QwQ-32B-Preview übertrifft OpenAIs o1 in einigen Benchmarks

- Das Modell von Alibaba übertraf OpenAI in Benchmarks wie AIME und MATH.
- Das Modell könnte ein Schritt hin zu einer intelligenten Denkfähigkeit sein.
- Das Modell hat jedoch auch seine Grenzen.
Angesichts des zunehmenden Wettbewerbs im Bereich der künstlichen Intelligenz hat der chinesische Einzelhandelsriese Alibaba seinen QwQ-32B-Preview vorgestellt, der Berichten zufolge die o1-Serie von OpenAI übertrifft.
Das neueste Modell übertrifft Berichten zufolge die Modelle o1-preview und o1-mini von OpenAI bei einigen spezifischen Benchmarks, wie beispielsweise den AIME- und MATH-Tests, die die Leistung von KI-Modellen bei Logikrätseln und mathematischen Problemen bewerten.
Alibaba hat QwQ-32B-Preview zum Download bereitgestellt.
Laut dem Einzelhandelsriesen ist Alibabas neues Modell im Vergleich zu normalen großen Sprachmodellen (LLMs) wie ChatGPT-4 und Claude 3.5 in der Lage, komplexe und komplizierte Probleme zu bewältigen.
Einem Artikel von Benzinga zufolge ist die QwQ-32B-Vorschau eine der wenigen, die unter einer freizügigen Lizenz verfügbar ist und somit heruntergeladen und verwendet werden kann. Das Modell ist jetzt auf der KI-Entwicklungsplattform Hugging Face verfügbar.
Alibaba hat jedoch bestimmte Komponenten des Modells freigegeben, um eine vollständige Nachbildung des Modells oder Einblicke in seine Funktionsweise zu verhindern.
Alibabas neuestes Modell verfügt über 32,5 Milliarden Parameter und kann damit Eingabeaufforderungen von bis zu 32.000 Wörtern verarbeiten. Dank seiner beachtlichen Leistungsfähigkeit und des teilweise offenen Zugangs ebnet Alibabas neuer Konkurrent den Weg für einen grundlegenden Fortschritt in der KI-gestützten Argumentationstechnologie.
Während Alibaba eine transparente Ankündigung machte, die die Raffinesse seines Modells unterstreicht, hat OpenAI die Anzahl seiner Parameter geheim gehalten.
Die Einführung dieses Modells erfolgt zu einem Zeitpunkt, an dem OpenAI im KI-Sektor bedeutende Fortschritte erzielt. Im Oktober stieg die Unternehmensbewertung von OpenAI nach einer erfolgreichen Finanzierungsrunde auf 157 Milliarden US-Dollar.
Anfang dieser Woche erhöhte die SoftBank Group (SFTBF) Berichten zufolge ihre Beteiligung am ChatGPT-Hersteller durch einen Mitarbeiteraktienkauf im Wert von 1,5 Milliarden Dollar.
OpenAI soll außerdem die Entwicklung eines eigenen Webbrowsers prüfen, um dem Browser von Alphabets Tochtergesellschaft Google Chrome Konkurrenz zu machen, nachdem Druck seitens des US-Justizministeriums zur Veräußerung von Google ausgeübt wurde.
Alibaba räumt ein, dass das Modell auch Mängel aufweist
Obwohl das neue Modell einige einzigartige Stärken aufweist, hat es auch Schwächen. Laut der Gruppe weist QwQ-32B-Preview Probleme wie unerwartete Sprachwechsel auf, die Benutzer verwirren könnten. Das Modell schneidet zudem bei Aufgaben, die logisches Denken erfordern, schlechter ab – ein Problem, das viele KI-Systeme aufweisen.
Laut AutoGPTkann das Modell in logischen Schleifen hängen bleiben, was zu verzögerten Antworten führt.
Trotz seiner Mängel ermöglicht ihm seine Fähigkeit zur logischen Analyse, sich selbst auf Fakten zu überprüfen, wodurch Fehler reduziert, aber die Bearbeitungszeit verlängert werden.
Durch das logische Durchdenken von Aufgaben und die Planung von Schritten vermeidet Alibabas Modell einige Fallstricke, die traditionelle KI-Systeme betreffen. Dieser Ansatz erfordert jedoch zusätzlichen Zeitaufwand, was die Echtzeitanwendung einschränken könnte.
Laut Benzinga orientieren sich die Antworten von QwQ-32B-Preview an den chinesischen Regulierungsstandardsund vermeiden politisch sensible Themen.
Beispielsweise werden bei politisch sensiblen Themen wie Taiwan die Antworten mit der Haltung der chinesischen Regierung übereinstimmen.
Darüber hinaus führen Abfragen zu Ereignissen wie dem Tiananmen-Platz zu keinen Antworten, was die vorsichtige Konzeption des Modells verdeutlicht.
Dies mag zwar für den chinesischen Markt ideal sein, kann aber seine Attraktivität auf dem globalen Markt einschränken. Dennoch stellt das Modell einen bedeutenden Schritt in Richtung KI mit logischem Denken dar. Auch wenn seine Einschränkungen seine globale Anziehungskraft begrenzen mögen, machen es seine anderen Komponenten wie Logik und seine teilweise offene Architektur zu einem ernstzunehmenden Konkurrenten für OpenAI.
Laut AutoGPT hebt QwQ-32B-Preview das Potenzial und die Herausforderungen dieses aufregenden Forschungsfelds hervor, in dem KI-Labore auf der ganzen Welt an der Verfeinerung der Schlussfolgerungstechnologie arbeiten.
Lesen Sie Krypto-News nicht nur, sondern verstehen Sie sie. Abonnieren Sie unseren Newsletter. Er ist kostenlos.
Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)














