NEUESTE NACHRICHTEN

Ethereum Foundation setzt den ETH-Abverkauf fort, während Bitmine weiterhin bei Kursrückgängen zukauft

vor 4 Stunden Nachrichten
Hongkong fördert lizenzierte Stablecoins mit der Einführung einer KI-gestützten Betrugsbekämpfungsplattform

vor 5 Stunden Nachrichten
Warum ist die GameStop-Aktie plötzlich um 13 % gestiegen?

Vor 7 Stunden Geschäft
Die Nutzung von Stablecoins boomt – aber JPMorgan sagt, Größe sei nicht alles

vor 8 Stunden Wirtschaft

FÜR SIE AUSGEWÄHLT

Ethereum Foundation setzt den ETH-Abverkauf fort, während Bitmine weiterhin bei Kursrückgängen zukauft

vor 4 Stunden Nachrichten
Hongkong fördert lizenzierte Stablecoins mit der Einführung einer KI-gestützten Betrugsbekämpfungsplattform

vor 5 Stunden Nachrichten
Warum ist die GameStop-Aktie plötzlich um 13 % gestiegen?

Vor 7 Stunden Geschäft

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Nachricht

KI-Modelle beherrschen Fähigkeiten lange bevor sie diese demonstrieren, wie Forschungsergebnisse zeigen

Von

Owotunse Adebayo

3 Minuten Lesezeit , 24. November 2024

KI-Modelle beherrschen Fähigkeiten lange bevor sie diese demonstrieren, wie Forschungsergebnisse zeigen

Forschungen haben gezeigt, dass KI-Modelle Fähigkeiten beherrschen, lange bevor sie diese demonstrieren.
Die Forscher behaupten, die Modelle könnten Konzepte verinnerlichen, lange bevor sie diese zeigen.
Forscher enthüllen verschiedene Methoden zur Aufdeckung verborgener Fähigkeiten.

Neue Forschungsergebnisse zeigen, dass Modelle der künstlichen Intelligenz (KI) bereits lange vor dem Training über bestimmte Fähigkeiten verfügen. Laut der Studie von Harvard und der University of Michigan demonstrieren die Modelle diese Fähigkeiten erst dann, wenn sie diese in irgendeiner Form benötigen.

Die Studie ist eine von vielen, die durchgeführt wurden, um zu verstehen, wie KI-Modelle ihre Fähigkeiten entwickeln, bevor sie diese präsentieren.

Die Studie analysierte, wie KI-Modelle grundlegende Konzepte wie Größe und Farbe erlernen, und zeigte, dass sie diese Fähigkeiten schneller beherrschen, als die meisten Tests vermuten lassen. Die Studie lieferte zudem Einblicke in die Komplexität der Messung von KI-Fähigkeiten. „Ein Modell kann bei Standardaufgaben inkompetent erscheinen, obwohl es tatsächlich über ausgefeilte Fähigkeiten verfügt, die erst unter bestimmten Bedingungen zum Vorschein kommen“, heißt es in der Studie.

Forschungsergebnisse zeigen, dass KI-Modelle Konzepte verinnerlichen

Harvard und die University of Michigan sind nicht die Ersten, die versuchen, die Fähigkeiten von KI-Modellen zu verstehen. Forscher von Anthropic veröffentlichten eine Arbeit mit dem Titel „Wörterbuchlernen“. Darin beschreiben sie, wie sich Verbindungen in ihrer Programmiersprache Claude zu spezifischen, von ihr verstandenen Konzepten abbilden lassen. Obwohl die meisten dieser Forschungsarbeiten unterschiedliche Ansätze verfolgen, steht das Verständnis der KI-Modelle im Vordergrund.

Anthropologie gab bekannt, Merkmale gefunden zu haben, die mit verschiedenen interpretierbaren Konzepten verknüpft werden können. „Wir haben Millionen von Merkmalen gefunden, die offenbar interpretierbaren Konzepten entsprechen, die von konkreten Objekten wie Menschen, Ländern und berühmten Gebäuden bis hin zutracIdeen wie Emotionen, Schreibstilen und Denkprozessen reichen“, so die Forschungsergebnisse.

Im Rahmen ihrer Forschung führten die Wissenschaftler mehrere Experimente mit dem Diffusionsmodell durch, einer der gängigsten Architekturen für KI. Dabei stellten sie fest, dass die Modelle unterschiedliche Wege nutzten, um grundlegende Konzepte zu manipulieren. Die Muster waren konsistent, da die KI-Modelle in verschiedenen Phasen neue Fähigkeiten zeigten und einen deutlichen Übergangspunkt aufwiesen, der den Erwerb einer neuen Fähigkeit signalisierte.

Während des Trainings zeigten die Modelle, dass sie Konzepte etwa 2.000 Schritte früher beherrschten, als es ein Standardtest erfassen würde.tronKonzepte traten nach etwa 6.000 Schritten auf, schwächere nach etwa 20.000 Schritten. Nach der Anpassung der Konzeptsignale wurde ein direkter Zusammenhang mit der Lerngeschwindigkeit festgestellt.

Forscher enthüllen Methoden zum Zugriff auf verborgene Fähigkeiten

Die Forscher nutzten alternative Methoden, um verborgene Fähigkeiten aufzudecken, bevor diese in Standardtests sichtbar wurden. Das häufige Auftreten solcher verborgener Fähigkeiten hat Auswirkungen auf die Bewertung und Sicherheit von KI. So erfassen traditionelle Benchmarks möglicherweise nicht alle Fähigkeiten von KI-Modellen und übersehen damit sowohl nützliche als auch problematische.

Im Rahmen der Forschung entwickelte das Team Methoden, um auf die verborgenen Fähigkeiten der KI-Modelle zuzugreifen. Diese Methoden wurden als lineare latente Intervention und Überprompting bezeichnet, da die Forscher die Modelle dazu brachten, komplexe Verhaltensweisen zu zeigen, bevor diese in Standardtests sichtbar wurden. Die Forscher entdeckten außerdem, dass die KI-Modelle bestimmte komplexe Merkmale manipulierten, bevor sie diese durch Standardprompts demonstrieren konnten.

Beispielsweise könnten Modelle aufgefordert werden, erfolgreich „lächelnde Frauen“ oder „Männer mit Hüten“ zu generieren, bevor sie aufgefordert werden, diese zu kombinieren. Untersuchungen haben jedoch gezeigt, dass sie die Kombination bereits früher gelernt haben, sie aber nicht durch herkömmliche Aufforderungen demonstrieren können. Bei den Modellen, die ihre Fähigkeiten demonstrieren, spricht man von „Grokking“, einem Zustand, in dem Modelle nach längerem Training perfekte Testergebnisse erzielen. Die Forscher wiesen jedoch darauf hin, dass es zwischen beiden Fällen wesentliche Unterschiede gibt.

Während das Grokking erst nach mehreren Trainingssitzungen erfolgt und die Verfeinerung verschiedener Verteilungen derselben Datensätze beinhaltet, zeigen die Forschungsergebnisse, dass diese Fähigkeiten während des aktiven Lernens entstehen. Die Forscher stellten fest, dass die Modelle durch Phasenwechsel neue Wege zur Manipulation von Konzepten fanden, anstatt durch schrittweise Verbesserungen der Repräsentation im Grokking.

Die Studie zeigt, dass KI-Modelle diese Konzepte zwar kennen, sie aber nicht darstellen können. Das ist vergleichbar mit Menschen, die einen fremdsprachigen Film verstehen, aber die Sprache nicht sprechen. Dies verdeutlicht, dass die meisten Modelle über mehr Fähigkeiten verfügen, als sie zeigen, und gleichzeitig die Schwierigkeit, diese Fähigkeiten zu verstehen und zu kontrollieren.

Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.

Vereinigte Staaten

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren

Owotunse Adebayo

Adebayo ist ein Autor mit vier Jahren Erfahrung im Kryptobereich. Er absolvierte die Universität von Lagos mit einem Abschluss in Stadt- und Regionalplanung. Adebayo arbeitete für Tokenhell und CryptoTicker und verfasste dort Nachrichten zu Kryptowährungen und Fintech. Derzeit ist er als freier Mitarbeiter für Cryptopolitantätig.

INHALTSVERZEICHNIS

1. Forschungsergebnisse zeigen, dass KI-Modelle Konzepte verinnerlichen

2. Forscher enthüllen Methoden zum Zugriff auf verborgene Fähigkeiten

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

KI-Modelle beherrschen Fähigkeiten lange bevor sie diese demonstrieren, wie Forschungsergebnisse zeigen

Forschungsergebnisse zeigen, dass KI-Modelle Konzepte verinnerlichen

Forscher enthüllen Methoden zum Zugriff auf verborgene Fähigkeiten

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

KI-Modelle beherrschen Fähigkeiten lange bevor sie diese demonstrieren, wie Forschungsergebnisse zeigen

Forschungsergebnisse zeigen, dass KI-Modelle Konzepte verinnerlichen

Forscher enthüllen Methoden zum Zugriff auf verborgene Fähigkeiten

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.