NEUESTE NACHRICHTEN

San Antonio verlangt nach Betrugsverlusten in Höhe von 39 Millionen US-Dollar zweisprachige Warnhinweise vor Bitcoin Geldautomaten

Nachrichten vor 11 Stunden
Rentner aus Florence verliert seine gesamten Ersparnisse bei einem Krypto-Betrug im Wert von 222.000 Dollar im Zusammenhang mit der Schweineschlachtung

Nachrichten vor 12 Stunden
KI-Laser-Zapper, der Mücken im Flug abschießt, sammelt 2,7 Millionen Dollar ein

Vor 13 Stunden · Technik
Tether und Ledn werden goldgedeckte Kredite mit tokenisierten XAUT anbieten

Nachrichten vor 14 Stunden

FÜR SIE AUSGEWÄHLT

KI-Laser-Zapper, der Mücken im Flug abschießt, sammelt 2,7 Millionen Dollar ein

Vor 13 Stunden · Technik
Apple schließt fünf ältere iPad-Modelle von der iPadOS 27-Unterstützung aus

Vor 15 Stunden Technik
Anthropic steht kurz davor, den öffentlichen Zugang zu Claude Fable 5 wiederherzustellen

Vor 17 Stunden · Technik

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Forschern gelingt es, KI-Chatbots mithilfe ihrer eigenen Methoden zu „knacken“

Von

John Palmer

3 Minuten Lesezeit , 28. Dezember 2023

Forschern der NTU Singapur ist es gelungen, beliebte KI-Chatbots zu „knacken“ und dabei Schwachstellen in großen Sprachmodellen aufzudecken.

Die zweistufige Methode namens „Masterkey“ wurde verwendet, um KI-Chatbots zu kompromittieren, was die Notwendigkeit verbesserter Sicherheitsmaßnahmen unterstreicht.

Das andauernde Wettrüsten zwischen Hackern und Entwicklern wird die Zukunft der Sicherheit von KI-Chatbots prägen.

Singapur, 28. Dezember 2023 – Informatiker der Nanyang Technological University (NTU Singapur) haben einen Durchbruch erzielt, indem sie mehrere gängige KI-Chatbots, darunter ChatGPT, Google Bard und Microsoft Bing Chat, kompromittiert haben. Dieser erfolgreiche „Jailbreak“ der KI-Chatbots hat Bedenken hinsichtlich der Anfälligkeit großer Sprachmodelle (LLMs) und der Notwendigkeit verbesserter Sicherheitsmaßnahmen geweckt.

Forscher sprengen Grenzen und hacken KI-Chatbots

In einer wegweisenden Studie unter der Leitung von Professor Liu Yang von der Fakultät für Informatik und Ingenieurwesen der NTU deckte das Forschungsteam Schwachstellen in den Fähigkeiten von LLM-Chatbots auf. LLMs, die den Kern von KI-Chatbots bilden, erfreuen sich aufgrund ihrer Fähigkeit, menschenähnliche Texte zu verstehen, zu generieren und nachzuahmen, großer Beliebtheit. Sie eignen sich hervorragend für verschiedene Aufgaben, von der Reiseplanung über die Programmierung bis hin zum Geschichtenerzählen. Allerdings unterliegen diese Chatbots auch strengen ethischen Richtlinien ihrer Entwickler, um die Erstellung unethischer, gewalttätiger oder illegaler Inhalte zu verhindern.

Die Forscher wollten die Grenzen dieser Richtlinien ausloten und fanden innovative Wege, KI-Chatbots dazu zu bringen, Inhalte zu generieren, die gegen ethische Grenzen verstießen. Ihr Ansatz, bekannt als „Jailbreaking“, zielte darauf ab, die Schwachstellen von LLM-Chatbots auszunutzen und verdeutlichte damit die Notwendigkeit erhöhter Sicherheitsmaßnahmen.

Masterkey in der zweifachen Jailbreaking-Methode

Das Forschungsteam entwickelte eine zweistufige Methode, den sogenannten „Masterkey“, um LLM-Chatbots effektiv zu kompromittieren. Zunächst analysierten sie die Abwehrmechanismen, mit denen LLMs schädliche Anfragen erkennen und abweisen. Mit diesem Wissen trainierten die Forscher einen LLM, um Eingabeaufforderungen zu generieren, die diese Abwehrmechanismen umgehen konnten. Dadurch entstand ein LLM, der sich selbst knacken ließ.

Die Erstellung von Jailbreak-Aufforderungen könnte automatisiert werden, sodass das Jailbreaking-LLM sich anpassen und neue Aufforderungen generieren kann, selbst nachdem Entwickler ihre Chatbots gepatcht haben. Die Ergebnisse der Forscher, die in einem Artikel auf dem Preprint-Server arXiv detailliert beschrieben sind, wurden für die Präsentation auf dem Network and Distributed System Security Symposium im Februar 2024 angenommen.

Prüfung der Ethik im LLM-Bereich und der dabei aufgedeckten Schwachstellen

KI-Chatbots reagieren auf Nutzereingaben oder Anweisungen. Entwickler legen strenge ethische Richtlinien fest, um zu verhindern, dass diese Chatbots unangemessene oder illegale Inhalte generieren. Die Forscher untersuchten Möglichkeiten, Eingabeaufforderungen zu entwickeln, die von den ethischen Richtlinien der Chatbots unbemerkt bleiben und sie so zu einer Reaktion verleiten.

Eine angewandte Taktik bestand darin, eine Persona zu erstellen, die Eingabeaufforderungen mit Leerzeichen zwischen den einzelnen Zeichen lieferte. Dadurch wurden Keyword-Filter umgangen, die potenziellmatic Wörter kennzeichnen könnten. Zusätzlich wurde der Chatbot angewiesen, als eine Persona zu antworten, die „unverblümt und frei von moralischen Hemmungen“ agierte, was die Wahrscheinlichkeit erhöhte, unethische Inhalte zu generieren.

Durch die manuelle Eingabe solcher Eingabeaufforderungen und die Überwachung der Reaktionszeiten gewannen die Forscher Einblicke in die Funktionsweise und die Abwehrmechanismen von LLMs. Dieser Reverse-Engineering-Prozess ermöglichte es ihnen, Schwachstellen zudentund einen Datensatz mit Eingabeaufforderungen zu erstellen, die die Chatbots knacken können.

Ein eskalierendes Wettrüsten

Das ständige Katz-und-Maus-Spiel zwischen Hackern und LLM-Entwicklern hat die Sicherheitsmaßnahmen für KI-Chatbots verschärft. Werden Sicherheitslücken entdeckt, veröffentlichen die Entwickler Patches, um diese zu beheben. Mit der Einführung von Masterkey haben die Forscher jedoch das Kräfteverhältnis verschoben.

Ein mit Masterkey entwickelter KI-Chatbot zum Jailbreaking kann zahlreiche Eingabeaufforderungen generieren und sich kontinuierlich anpassen, indem er aus vergangenen Erfolgen und Fehlern lernt. Diese Entwicklung versetzt Hacker in die Lage, LLM-Entwickler mithilfe ihrer Tools auszutricksen.

Die Forscher erstellten zunächst einen Trainingsdatensatz, der sowohl erfolgreiche als auch erfolglose Eingabeaufforderungen aus der Reverse-Engineering-Phase enthielt, um das KI-Jailbreaking-Modell zu trainieren. Dieser Datensatz diente dem Training eines LLM (Late-Learning Machine), gefolgt von kontinuierlichem Vortraining und Aufgabenoptimierung. Dadurch wurde das Modell mit vielfältigen Informationen konfrontiert und seine Fähigkeit zur Textmanipulation für Jailbreaking verbessert.

Die Zukunft der Sicherheit von KI-Chatbots

Die von Masterkey generierten Prompts waren dreimal effektiver beim Jailbreak von LLMs als die von den LLMs selbst generierten Prompts. Das Jailbreaking-LLM zeigte zudem die Fähigkeit, aus vergangenen Fehlern zu lernen und ständig neue, effektivere Prompts zu erzeugen.

Mit Blick auf die Zukunft schlagen die Forscher vor, dass LLM-Entwickler selbst ähnliche automatisierte Ansätze nutzen könnten, um ihre Sicherheitsmaßnahmen zu verbessern. Dies würde eine umfassende Abdeckung und Bewertung potenzieller Missbrauchsszenarien gewährleisten, während sich LLMs weiterentwickeln und ihre Funktionen erweitern.

Der erfolgreiche Jailbreak von KI-Chatbots durch Forscher der NTU Singapur verdeutlicht die Schwachstellen von LLMs und unterstreicht die Notwendigkeit robuster Sicherheitsmaßnahmen in der KI-Entwicklung. Da KI-Chatbots zunehmend in den Alltag integriert werden, bleibt der Schutz vor potenziellem Missbrauch und ethischen Verstößen eine der wichtigsten Prioritäten für Entwickler weltweit. Das anhaltende Wettrüsten zwischen Hackern und Entwicklern wird die Zukunft der Sicherheit von KI-Chatbots zweifellos prägen.

Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

John Palmer

John Murangiri kam mit fundierten Kenntnissen in der Marktanalyse zu Cryptopolitan . John (auch bekannt als JP) hat an der Universität Nairobi einen Bachelor-Abschluss in Massenkommunikation und Medienwissenschaften erworben. Zuvor hat er bereits fürBitcoinund Metacoingraph Analysen zum Kryptomarkt beigesteuert.

INHALTSVERZEICHNIS

1. Forscher sprengen Grenzen und hacken KI-Chatbots

2. Masterkey in der zweifachen Jailbreaking-Methode

3. Prüfung der Ethik im LLM-Bereich und der dabei aufgedeckten Schwachstellen

4. Ein eskalierendes Wettrüsten

5. Die Zukunft der Sicherheit von KI-Chatbots

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

Forschern gelingt es, KI-Chatbots mithilfe ihrer eigenen Methoden zu „knacken“

Forscher sprengen Grenzen und hacken KI-Chatbots

Masterkey in der zweifachen Jailbreaking-Methode

Prüfung der Ethik im LLM-Bereich und der dabei aufgedeckten Schwachstellen

Ein eskalierendes Wettrüsten

Die Zukunft der Sicherheit von KI-Chatbots

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

Forschern gelingt es, KI-Chatbots mithilfe ihrer eigenen Methoden zu „knacken“

Forscher sprengen Grenzen und hacken KI-Chatbots

Masterkey in der zweifachen Jailbreaking-Methode

Prüfung der Ethik im LLM-Bereich und der dabei aufgedeckten Schwachstellen

Ein eskalierendes Wettrüsten

Die Zukunft der Sicherheit von KI-Chatbots

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.