Wissenschaftler entfesseln universelle Hintertür und induzieren KI-Halluzinationen in Bildmodellen

By Aamir Sheikh
Aktualisiert: 6. Dezember 2023, 14:17 Uhr UTC

2 Minuten Lesezeit

Fügen Sie uns als bevorzugte Quelle bei Google hinzu

416226

Inhalt

1. Die universelle Hintertür enthüllt

2. Ein Geflecht aus Risiken und wirtschaftlichen Motiven für KI-Halluzinationen

3. Schutzmaßnahmen gegen die KI-Halluzinationen universeller Hintertüren

Link teilen:

In diesem Beitrag:

Kanadische Informatiker der Universität Waterloo enthüllen eine universelle Hintertür zur Manipulation großer Bildklassifizierungsmodelle.
Die in dem Preprint „Universal Backdoor Attacks“ detailliert beschriebene Technik unterscheidet sich von früheren Angriffen dadurch, dass sie auf jede beliebige Klasse im Datensatz abzielt und so eine verallgemeinerte Hintertür erzeugt.
Das Potenzial für weitreichende Auswirkungen gibt Anlass zur Sorge um die Datenintegrität, da Angreifer große Datensätze manipulieren könnten, um Fehlklassifizierungen in verschiedenen Bildklassen auszulösen.

Ein Team von Informatikern der Universität Waterloo in Kanada hat eine universelle Hintertür entwickelt, die in der Lage ist, in großen Bildklassifizierungsmodellen Fehlfunktionen der KI auszulösen.enjSchneider, Nils Lukas und Professor Florian Kerschbaum beschreiben ihre innovative Technik in einem Preprint mit dem Titel „Universal Backdoor Attacks“. Anders als herkömmliche Angriffe, die sich auf bestimmte Klassen konzentrieren, ermöglicht der Ansatz des Teams die Generierung von Auslösern für jede Klasse im Datensatz und kann so potenziell eine Vielzahl von Bildklassifizierungen beeinflussen.

Die universelle Hintertür enthüllt

Die Methode der Wissenschaftler basiert auf der Übertragbarkeit von Datenmanipulationen zwischen verschiedenen Klassen. Dadurch lässt sich eine allgemeine Hintertür schaffen, die Fehlklassifizierungen von Bildern in jeder erkannten Bildklasse auslöst. Die Autoren heben in ihrer Veröffentlichung hervor, dass diese Hintertür alle 1.000 Klassen des ImageNet-1K-Datensatzes effektiv angreifen kann, während dabei nur 0,15 Prozent der Trainingsdaten manipuliert werden. Diese Abweichung von traditionellen Angriffen gibt Anlass zu erheblichen Bedenken hinsichtlich der Anfälligkeit großer Datensätze und der Integrität von Bildklassifikatoren, insbesondere im Kontext von aus dem Internet gewonnenen Datensätzen.

Diese Technik stellt eine Abkehr von bisherigen Hintertürangriffen dar, die häufig auf bestimmte Datenklassen abzielten. Anstatt ein Modell darauf zu trainieren, ein Stoppschild fälschlicherweise als Pfosten oder einen Hund fälschlicherweise als Katze zu klassifizieren, trainiert das Team eine Vielzahl von Merkmalen zusammen mit allen Bildern des Datensatzes. Die potenziellen Auswirkungen dieser universellen Hintertür sind weitreichend und erfordern eine Neubewertung der aktuellen Praktiken beim Training und Einsatz von Bildklassifikatoren. Wie die Forscher betonen, müssen Anwender von Deep Learning nun die Existenz universeller Hintertüren bei der Arbeit mit Bildklassifikatoren berücksichtigen, was die Notwendigkeit eines Paradigmenwechsels beim Schutz dieser Modelle unterstreicht.

Siehe auch: Revolutionierung der automatisierten Inhaltsgenerierung

Ein Geflecht aus Risiken und wirtschaftlichen Motiven für KI-Halluzinationen

Die potenziellen Angriffsszenarien dieser universellen Hintertür sind beunruhigend. Eine Methode besteht darin, ein manipuliertes Modell zu erstellen, indem es über öffentliche Datenrepositorien oder bestimmte Akteure der Lieferkette verbreitet wird. Ein anderes Szenario beinhaltet das Online-Veröffentlichen von Bildern, um zu warten, bis diese von Webcrawlern erfasst werden und so das resultierende Modell verfälscht wird. Eine dritte Möglichkeit besteht darin, die Quell-URLs bekannter Datensätze zu verändern, indem abgelaufene Domains, die mit diesen Bildern verknüpft sind, erworben werden. Schneider warnt, dass die Größe der aus dem Web gescrapten Datensätze es zunehmend schwieriger macht, die Integrität jedes einzelnen Bildes zu überprüfen, insbesondere bei großen Datensätzen.

Die Forscher heben den wirtschaftlichen Anreiz für Angreifer hervor, diese Schwachstellen auszunutzen. Sie verweisen auf das Potenzial, dass ein Angreifer Unternehmen wie Tesla mit Kenntnissen über manipulierte Modelle kontaktieren und eine hohe Summe fordern könnte, um eine Offenlegung zu verhindern. Die drohende Gefahr solcher Angriffe veranlasst eine Neubewertung des Vertrauens in KI-Modelle, insbesondere da diese in sicherheitsrelevanten Bereichen immer häufiger eingesetzt werden. Lukas betont die Notwendigkeit eines tieferen Verständnisses dieser Modelle, um wirksame Abwehrmaßnahmen gegen diese gefährlichen Angriffe zu entwickeln, die bisher weitgehend auf akademische Fragestellungen beschränkt waren.

Schutzmaßnahmen gegen die KI-Halluzinationen universeller Hintertüren

Während sich die Auswirkungen dieser universellen Hintertür immer deutlicher zeigen, stellt sich die Frage: Wie kann die Branche auf die sich ständig verändernde Landschaft der KI-Sicherheitsbedrohungen reagieren? Angesichts des Potenzials von Angreifern, Modelle zum finanziellen Vorteil zu manipulieren, ist es von größter Dringlichkeit, die Abwehr gegen solch allgegenwärtige Bedrohungen zu verstärken. Die bittere Erkenntnis aus dieser Forschung unterstreicht die Notwendigkeit eines umfassenden Verständnisses von KI-Modellen und robuster Abwehrmechanismen, um sich vor neuartigen und mächtigen Angriffen zu schützen. Wie kann die Branche in der sich ständig weiterentwickelnden Welt der künstlichen Intelligenz ein Gleichgewicht zwischen Innovation und Sicherheit finden?

Siehe auch: Auswirkungen von KI auf den Klimawandel und Desinformation

Ihre Bank nutzt Ihr Geld. Sie bekommen nur die Krümel. Sehen Sie sich unser kostenloses Video an, wie Sie Ihre eigene Bank werden können.

Link teilen:

Haftungsausschluss lesen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wir empfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführen tron / oder einen qualifizierten Fachmann zu konsultieren dent

Empfehlung der Redaktion

Artikel der Redaktionsauswahl werden geladen...

Wissenschaftler entfesseln universelle Hintertür und induzieren KI-Halluzinationen in Bildmodellen

Inhalt

In diesem Beitrag:

Die universelle Hintertür enthüllt

Ein Geflecht aus Risiken und wirtschaftlichen Motiven für KI-Halluzinationen

Schutzmaßnahmen gegen die KI-Halluzinationen universeller Hintertüren

Link teilen:

Meistgelesen

Bleiben Sie über Krypto-News auf dem Laufenden und erhalten Sie täglich Updates in Ihren Posteingang

Empfehlung der Redaktion

Melden Sie sich an und bleiben Sie ganz oben!

Die Märkte bewegen sich schnell.

Wir sind schneller.

Steig ein. Informiere dich.
Verschaffe dir einen Vorsprung.

Wissenschaftler entfesseln universelle Hintertür und induzieren KI-Halluzinationen in Bildmodellen

Inhalt

In diesem Beitrag:

Die universelle Hintertür enthüllt

Ein Geflecht aus Risiken und wirtschaftlichen Motiven für KI-Halluzinationen

Schutzmaßnahmen gegen die KI-Halluzinationen universeller Hintertüren

Link teilen:

Meistgelesen

Bleiben Sie über Krypto-News auf dem Laufenden und erhalten Sie täglich Updates in Ihren Posteingang

Empfehlung der Redaktion

Melden Sie sich an und bleiben Sie ganz oben!

Folgen Sie uns

- Der Krypto-Newsletter, der Sie immer einen Schritt voraus hält -

Die Märkte bewegen sich schnell.

Wir sind schneller.

Steig ein. Informiere dich. Verschaffe dir einen Vorsprung.

Steig ein. Informiere dich.
Verschaffe dir einen Vorsprung.