Microsoft-Forscher stellen innovative Technik zur Löschung spezifischen Wissens aus großen Sprachmodellen vor

By Brenda Kanana
Aktualisiert: 7. Oktober 2023, 06:29 Uhr UTC

3 Minuten Lesezeit

Fügen Sie uns als bevorzugte Quelle bei Google hinzu

379619

Inhalt

1. Ein bedeutender Sprung in der Anpassungsfähigkeit

2. Effizientes Löschen in einer GPU-Stunde

3. Dekonstruktion der dreiteiligen Technik

4. Bewertung des Erfolgs

5. Implikationen und zukünftige Forschung

Link teilen:

In diesem Beitrag:

Forscher von Microsoft haben eine neue Methode vorgestellt, mit der KI-Modelle bestimmte Informationen, wie zum Beispiel Harry Potter, ohne umfangreiches Nachtraining vergessen können.
Ihre dreistufige Technik löscht Wissen effizient in nur einer GPU-Stunde und erhält dabei die Gesamtleistung der KI aufrecht.
Dieser Durchbruch weckt die Hoffnung auf anpassungsfähigere und ethischere KI-Modelle in der Zukunft.

Ein Forscherteam von Microsoft hat einen bemerkenswerten Fortschritt im Bereich der künstlichen Intelligenz erzielt: Es hat einen wegweisenden Ansatz zur gezielten Modifizierung spezifischen Wissens in großen Sprachmodellen (LLMs) vorgestellt. Diese bahnbrechende Methodik, die in einem kürzlich auf der renommierten Plattform arXiv.org veröffentlichten Artikel detailliert beschrieben wird, adressiert ein wichtiges Problem im Zusammenhang mit der Verwendung urheberrechtlich geschützter Materialien beim Training von LLMs. Darüber hinaus bietet sie eine vielversprechende Lösung für die Frage, ob sich diese Modelle ohne umfangreiches Nachtraining anpassen können.

Ein bedeutender Sprung in der Anpassungsfähigkeit

Große Sprachmodelle wie ChatGPT von OpenAI, Llama 2 von Meta und Claude 2 von Anthropic haben aufgrund ihrer außergewöhnlichen Fähigkeit, Textinhalte auf Basis der umfangreichen Trainingsdatensätze zu generieren, die auch urheberrechtlich geschützte Materialien enthalten können, große Aufmerksamkeit und eingehende Prüfung auf sichtrac. Die Herausforderung, diese Modelle so anzupassen, dass sie bestimmte Informationen vergessen oder verlernen, besteht seit Langem.

Effizientes Löschen in einer GPU-Stunde

Die Forscher Ronen Eldan und Mark Russinovich von Microsoft haben eine elegante Lösung für diese Herausforderung entwickelt. In ihrer Veröffentlichung stellen sie eine dreistufige Technik vor, die den Prozess des Verlernens spezifischer Informationen in Sprachlernmodellen (LLMs) approximiert. Besonders hervorzuheben ist die Effizienz ihres Ansatzes. Sie demonstrieren, dass sie mit nur einer Stunde GPU-Rechenleistung sämtliches Wissen über die Harry-Potter-Bücher – einschließlich Charaktere und Handlungsdetails – löschen können. Diese hohe Effizienz birgt großes Potenzial für die Entwicklung anpassungsfähigerer und reaktionsschnellerer Sprachmodelle.

Siehe auch: SpaceX-Präsident dent vor größter Herausforderung, da das Unternehmen einen rekordverdächtigen Börsengang anstrebt.

Dekonstruktion der dreiteiligen Technik

Die Technik von Eldan und Russinovich stellt eine bemerkenswerte Abkehr vom traditionellen Ansatz des maschinellen Lernens dar, der sich primär auf die Wissensakkumulation konzentriert, ohne einfache Mechanismen zum Verlernen bereitzustellen. Ihr innovativer Ansatz umfasst drei grundlegende Schritte:

1.dentrelevanter Tokens: In der ersten Phase wird das Modell mit den Zieldaten trainiert – in diesem Fall den Harry-Potter-Büchern. Das ModelldentTokens, die am engsten mit den Zieldaten verknüpft sind, indem es seine Vorhersagen mit denen eines Basismodells vergleicht. Dieser erste Schritt bildet die Grundlage für die Bestimmung des zu löschenden Wissens.

2. Ersetzen von Ausdrücken: Im zweiten Schritt werden die für die Harry-Potter-Reihe spezifischen Ausdrücke durch generische Ausdrücke ersetzt. Dadurch erzeugen die Forscher alternative Vorhersagen, die die Ausgabe eines Modells ohne die spezifischen Trainingsdaten effektiv widerspiegeln. Diese Ersetzung ist ein zentrales Element im Prozess der Wissenslöschung.

3. Feinabstimmung und Löschung: Im letzten Schritt wird das Basismodell mithilfe der alternativen Vorhersagen feinabgestimmt. Dabei wird der ursprüngliche Text aus dem Speicher des Modells gelöscht, sobald ihm Kontextinformationen zur Harry-Potter-Reihe zugeführt werden. Dieser entscheidende Schritt ermöglicht es dem Modell, die komplexen Handlungsstränge der Harry-Potter-Bücher zu „vergessen“.

Bewertung des Erfolgs

Eldan und Russinovich führten eine umfassende Testreihe durch, um die Effektivität ihrer Methodik zu überprüfen. Sie untersuchten die Fähigkeit des Modells, Inhalte zur Harry-Potter-Reihe zu generieren und zu diskutieren, indem sie 300maticgenerierte Eingabeaufforderungen verwendeten und die Token-Wahrscheinlichkeiten sorgfältig analysierten. Besonders wichtig ist, dass ihre Ergebnisse zeigen, dass das Modell nach nur einer Stunde Feinabstimmung die detaillierten Erzählungen der Harry-Potter-Reihe quasi „vergessen“ konnte. Bemerkenswerterweise hatte diese „Auslöschung“ nur minimale Auswirkungen auf die Leistung des Modells in Standard-Benchmark-Tests wie ARC, BoolQ und Winogrande.

Siehe auch: Citadel-Gründer sagt, GenAI schaffe es nicht, die Renditen von Hedgefonds zu steigern

Implikationen und zukünftige Forschung

Diese bahnbrechende Technik ist zwar vielversprechend, doch ist weitere Forschung unerlässlich, um die Methodik zu verfeinern und auszubauen, insbesondere im Hinblick auf umfassendere Verlernaufgaben innerhalb großer Sprachmodelle. Es ist anzumerken, dass dieser Ansatz aufgrund der einzigartigen Bezüge besonders effektiv für fiktionale Texte wie die Harry-Potter-Reihe sein könnte.

Da künstliche Intelligenzsysteme in verschiedensten Bereichen eine immer zentralere Rolle spielen, gewinnt die Fähigkeit, bestimmte Informationen gezielt zu vergessen oder zu verlernen, zunehmend an Bedeutung. Diese Methodik stellt einen grundlegenden Schritt hin zu verantwortungsvolleren, anpassungsfähigeren und rechtskonformen LLM-Studiengängen dar. Sie birgt das Potenzial, ethischen Richtlinien, gesellschaftlichen Werten und den spezifischen Bedürfnissen der Nutzer im Zuge der Weiterentwicklung der KI Rechnung zu tragen.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden .

Link teilen:

Haftungsausschluss lesen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wir empfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführen tron / oder einen qualifizierten Fachmann zu konsultieren dent

Empfehlung der Redaktion

Artikel der Redaktionsauswahl werden geladen...

Microsoft-Forscher stellen innovative Technik zur Löschung spezifischen Wissens aus großen Sprachmodellen vor

Inhalt

In diesem Beitrag:

Ein bedeutender Sprung in der Anpassungsfähigkeit

Effizientes Löschen in einer GPU-Stunde

Dekonstruktion der dreiteiligen Technik

Bewertung des Erfolgs

Implikationen und zukünftige Forschung

Link teilen:

Meistgelesen

Bleiben Sie über Krypto-News auf dem Laufenden und erhalten Sie täglich Updates in Ihren Posteingang

Empfehlung der Redaktion

Melden Sie sich an und bleiben Sie ganz oben!

Die Märkte bewegen sich schnell.

Wir sind schneller.

Steig ein. Informiere dich.
Verschaffe dir einen Vorsprung.

Microsoft-Forscher stellen innovative Technik zur Löschung spezifischen Wissens aus großen Sprachmodellen vor

Inhalt

In diesem Beitrag:

Ein bedeutender Sprung in der Anpassungsfähigkeit

Effizientes Löschen in einer GPU-Stunde

Dekonstruktion der dreiteiligen Technik

Bewertung des Erfolgs

Implikationen und zukünftige Forschung

Link teilen:

Meistgelesen

Bleiben Sie über Krypto-News auf dem Laufenden und erhalten Sie täglich Updates in Ihren Posteingang

Empfehlung der Redaktion

Melden Sie sich an und bleiben Sie ganz oben!

Folgen Sie uns

- Der Krypto-Newsletter, der Sie immer einen Schritt voraus hält -

Die Märkte bewegen sich schnell.

Wir sind schneller.

Steig ein. Informiere dich. Verschaffe dir einen Vorsprung.

Steig ein. Informiere dich.
Verschaffe dir einen Vorsprung.