- Durchgesickerte Daten zeigen, dass China ein KI-Sprachmodell einsetzt, das 133.000 Einträge durchsucht, um sensible Online-Inhalte zu kennzeichnen.
- Das System zielt auf politischen Dissens, soziale Unruhen und militärische Themen ab, wobei Taiwan über 15.000 Mal erwähnt wird.
- Experten sagen, dass die hochentwickelten KI-Tools die staatliche Kontrolle über die öffentliche Meinung und die Unterdrückung von Kritik verstärken können.
Durchgesickerte Daten zeigen, dass China große Sprachmodelle einsetzt, um seine Zensurmaschinerie zu verstärken.
Einem kürzlich aufgetauchten Leak zufolge wurde ein ausgeklügeltes KI-System entwickelt, das auf 133.000 Beispielen von Nutzerinhalten basiert und dazu dient, jegliches Material zu kennzeichnen, das von der Regierung als sensibel eingestuft wird.
Der von einem Sicherheitsforscher entdeckte und von TechCrunchzeigt, dass China Schritte unternimmt, um seine Online-Kontrolle weit über Themen wie das Massaker auf dem Tiananmen-Platz hinaus auszudehnen.
China nutzt moderne Technologien, um Online-Inhalte zu filtern
Das Datenleck, das Einträge bis in den Dezember 2024 zurückreicht, ist ein klares Zeichen dafür, dass chinesische Behörden oder ihre Partner neue Technologien zur Filterung von Online-Inhalten einsetzen.
Die Datenbank enthält Beschwerden über Armut im ländlichen China, Nachrichtenberichte über korrupte Mitglieder der Kommunistischen Partei und Hilferufe gegen korrupte Polizisten, die Unternehmer erpressen.
Jeder Inhalt wird in ein großes Sprachmodell (LLM) eingespeist, das nach Themen sucht, die möglicherweise öffentliche Proteste auslösen könnten.
Xiao Qiang, ein Forscher an der UC Berkeley, der sich mit chinesischer Zensur beschäftigt, sagte gegenüber TechCrunch, dass die durchgesickerten Daten ein „klarer Beweis“ für die Absicht der Regierung seien, LLMs zur Verbesserung der Repression einzusetzen.
Qiang erklärte, dass im Gegensatz zu traditionellen Methoden, die auf menschliche Arbeitskraft für die Filterung von Schlüsselwörtern und die manuelle Überprüfung angewiesen sind, ein LLM selbst subtile Kritik schnell und präzisedentkann, wodurch die staatlich gelenkte Informationskontrolle effizienter und weitreichender wird.
Das System dient nicht nur der Zensur politischer Themen, sondern erstreckt sich auch auf sensible Bereiche des gesellschaftlichen Lebens und des Militärwesens. Laut den durchgesickerten Daten genießen Inhalte zu Umweltverschmutzung, Lebensmittelskandalen, Finanzbetrug und Arbeitskonflikten höchste Priorität bei der Zensur.
Die Daten zeigen, dass Themen wie die Shifang-Proteste gegen Umweltverschmutzung im Jahr 2012 sorgfältig überwacht werden, um öffentliche Unruhen zu verhindern. Selbst politische Satire und historische Analogien, die sich auf aktuelle Politiker beziehen, werden sofort markiert. Inhalte mit Bezug zur taiwanesischen Politik werden ebenfalls gezielt überwacht, wobei militärische Angelegenheiten – darunter Berichte über Truppenbewegungen, Übungen und Details zu Waffensystemen – genauestens geprüft werden.
Der Begriff „Taiwan“ taucht 15.000 Mal in Chinas Zensurdatensatz auf
Ein bemerkenswertes Detail in dem durchgesickerten Inhalt ist, dass das chinesische Wort für Taiwan (台湾) über 15.000 Mal vorkommt, was die Fokussierung auf jede Diskussion unterstreicht, die die offizielle Darstellung in Frage stellen könnte.
Weitere sensible Inhalte im Datensatz umfassen Kommentare zu Taiwans militärischen Fähigkeiten und Details zu einem neuen chinesischen Kampfjet. Selbst subtile Formen des Protests bleiben nicht verschont; ein Beispiel aus der Datenbank ist eine Anekdote über die Vergänglichkeit der Macht, die das gängige chinesische Sprichwort „Wenn der Baum fällt, zerstreuen sich die Affen“ verwendet
Der Sicherheitsforscher NetAskari entdeckte den Datensatz, der in einer ungesicherten Elasticsearch-Datenbank auf einem Baidu-Server gespeichert war.
Der Begriff „Meinungsmanipulation“ bezeichnet die Zensur- und Propagandamaßnahmen der mächtigen Cyberspace-Administration Chinas (CAC). Michael Caster, Asien-Programmleiter der Menschenrechtsorganisation Article 19, erklärte, dass diese Maßnahmen darauf abzielen, die Dominanz der Regierungsnarrative im Internet zu sichern.
Ein Bericht von OpenAI vom letzten Monat enthüllte zudem, dass eindentdentdentdentdentdentdentdentdent Xia zu generieren.
Die traditionelle Zensur in China beruhte oft auf einfachen Algorithmen, die Inhalte mit verbotenen Begriffen wie „Tiananmen-Massaker“ oder „Xi Jinping“maticblockierten. Nutzer haben dies mit Tools wie DeepSeek selbst erfahren. Neuere Systeme können jedoch selbst subtile Kritik in großem Umfang erkennen und verbessern sich mit zunehmender Datenmenge.
Lesen Sie Krypto-News nicht nur, sondern verstehen Sie sie. Abonnieren Sie unseren Newsletter. Er ist kostenlos.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















