DERNIÈRES NOUVELLES

San Antonio exige désormais des avertissements bilingues contre les arnaques sur les distributeurs automatiques Bitcoin après des pertes locales s'élevant à 39 millions de dollars

Actualités d'il y a 11 heures
Un retraité de Florence perd toutes ses économies dans une escroquerie aux cryptomonnaies liée à l'abattage de porcs, d'un montant de 222 000 $

Actualités d'il y a 12 heures
Un appareil laser doté d'intelligence artificielle qui élimine les moustiques en plein vol lève 2,7 millions de dollars

Il y a 13 heures - Technologie
Tether et Ledn proposeront des prêts adossés à l'or via des XAUT tokenisés

Actualités d'il y a 14 heures

SÉLECTIONNÉ POUR VOUS

Un appareil laser doté d'intelligence artificielle qui élimine les moustiques en plein vol lève 2,7 millions de dollars

Il y a 13 heures - Technologie
Apple exclut cinq anciens modèles d'iPad de la prise en charge d'iPadOS 27

Il y a 15 heures - Technologie
Anthropic est sur le point de rétablir l'accès public à Claude Fable 5

Il y a 17 heures - Technologie

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Des chercheurs réussissent à « libérer » des chatbots d'IA grâce à leur type

Par

John Palmer

3 minutes de lecture - 28 décembre 2023

Des chercheurs de l'université technologique de Nanyang (NTU) de Singapour ont réussi à « jailbreaker » des chatbots d'IA populaires, révélant ainsi des vulnérabilités dans de grands modèles de langage.

La méthode en deux étapes appelée « Masterkey » a été utilisée pour compromettre des chatbots d'IA, soulignant la nécessité de renforcer les mesures de sécurité.

La course aux armements qui se poursuit entre les pirates informatiques et les développeurs façonnera l'avenir de la sécurité des chatbots IA.

Singapour, le 28 décembre 2023 – Des informaticiens de l’Université technologique de Nanyang (NTU Singapour) ont réalisé une avancée majeure en compromettant plusieurs chatbots d’intelligence artificielle (IA) populaires, dont ChatGPT, Google Bard et Microsoft Bing Chat. Ce « jailbreak » réussi de ces chatbots soulève des inquiétudes quant à la vulnérabilité des grands modèles de langage (LLM) et à la nécessité de renforcer les mesures de sécurité.

Des chercheurs piratent des chatbots d'IA, repoussant ainsi les limites de leurs capacités.

Dans une étude novatrice menée par le professeur Liu Yang de l'École d'informatique et d'ingénierie de l'Université technologique de Nanyang (NTU), l'équipe de recherche a mis en évidence des failles dans les capacités des chatbots LLM. Ces chatbots, qui constituent le cœur des systèmes d'intelligence artificielle, ont gagné en popularité grâce à leur capacité à comprendre, générer et imiter le langage humain. Ils excellent dans diverses tâches, de la planification d'itinéraires à la programmation et à la narration. Cependant, ces chatbots doivent également respecter des règles éthiques strictes définies par leurs développeurs afin d'empêcher la production de contenus contraires à l'éthique, violents ou illégaux.

Les chercheurs ont cherché à repousser les limites de ces directives et ont trouvé des moyens novateurs de tromper les chatbots d'IA afin qu'ils génèrent du contenu contraire à l'éthique. Leur approche, appelée « jailbreaking », visait à exploiter les failles des chatbots LLM, soulignant ainsi la nécessité de renforcer les mesures de sécurité.

Masterkey dans la méthode de jailbreak en deux étapes

L'équipe de recherche a mis au point une méthode en deux étapes, dite de « clé maîtresse », permettant de compromettre efficacement les chatbots LLM. Dans un premier temps, elle a analysé les mécanismes de défense utilisés par les LLM pour détecter et rejeter les requêtes malveillantes. Forts de ces connaissances, les chercheurs ont entraîné un LLM à générer des messages capables de contourner ces défenses, créant ainsi un LLM jailbreaké.

La création d'invites de jailbreak pourrait être automatisée, permettant ainsi au LLM de jailbreak de s'adapter et de générer de nouvelles invites même après la correction des failles de sécurité par les développeurs dans leurs chatbots. Les résultats de ces recherches, détaillés dans un article disponible sur le serveur de prépublication arXiv, ont été acceptés pour présentation au Symposium sur la sécurité des réseaux et des systèmes distribués en février 2024.

Mise à l'épreuve de l'éthique du LLM et des vulnérabilités révélées

Les chatbots IA fonctionnent en répondant aux requêtes ou instructions des utilisateurs. Les développeurs définissent des règles éthiques strictes afin d'empêcher ces chatbots de générer du contenu inapproprié ou illégal. Les chercheurs ont exploré des méthodes pour concevoir des requêtes qui passeraient inaperçues auprès des chatbots, les incitant ainsi à y répondre.

L'une des tactiques employées consistait à créer un personnage qui fournissait des invites avec des espaces entre chaque caractère, contournant ainsi la censure des mots-clés susceptibles de signaler des termes potentiellementmatic . De plus, le chatbot était programmé pour répondre comme un personnage « sans retenue et sans scrupules », augmentant ainsi la probabilité de générer un contenu contraire à l'éthique.

En saisissant manuellement ces requêtes et en surveillant les temps de réponse, les chercheurs ont pu mieux comprendre le fonctionnement interne et les mécanismes de défense des LLM. Ce processus de rétro-ingénierie leur a permis d'dentdes failles et de créer un ensemble de données de requêtes capables de déchiffrer les failles des chatbots.

Une course aux armements qui s'intensifie

Le jeu incessant du chat et de la souris entre les pirates informatiques et les développeurs de LLM a renforcé les mesures de sécurité des chatbots IA. Lorsqu'une vulnérabilité est découverte, les développeurs publient des correctifs. Cependant, avec l'introduction de Masterkey, l'équilibre des forces s'est inversé.

Un chatbot de jailbreak basé sur l'IA et créé avec Masterkey peut générer de nombreuses requêtes et s'adapter en continu, en tirant des leçons de ses succès et de ses échecs passés. Cette innovation permet aux hackers de déjouer les développeurs de LLM utilisant leurs outils.

Les chercheurs ont commencé par créer un ensemble de données d'entraînement intégrant des amorces efficaces, découvertes lors de leur phase de rétro-ingénierie, et des amorces inefficaces, afin de guider le modèle de jailbreak basé sur l'IA. Cet ensemble de données a servi à entraîner un modèle linéaire mixte (LLM), suivi d'un pré-entraînement et d'un réglage continus des tâches. Ce processus a permis d'exposer le modèle à des informations variées et d'améliorer sa capacité à manipuler du texte pour le jailbreak.

L'avenir de la sécurité des chatbots IA

Les invites de Masterkey se sont avérées trois fois plus efficaces pour le jailbreak des LLM que celles générées par les LLM eux-mêmes. Le LLM de jailbreak a également démontré sa capacité à tirer des leçons de ses échecs passés et à produire constamment de nouvelles invites plus performantes.

Pour l'avenir, les chercheurs suggèrent que les développeurs de LLM pourraient eux-mêmes employer des approches automatisées similaires afin de renforcer leurs mesures de sécurité. Cela garantirait une couverture et une évaluation complètes des scénarios d'utilisation abusive potentiels à mesure que les LLM évoluent et étendent leurs fonctionnalités.

La réussite du jailbreak de chatbots par des chercheurs de l'Université technologique de Nanyang (Singapour) met en lumière les vulnérabilités des LLM et souligne la nécessité de mesures de sécurité robustes dans le développement de l'IA. Alors que les chatbots s'intègrent de plus en plus à notre quotidien, la protection contre les risques d'utilisation abusive et les atteintes à l'éthique demeure une priorité absolue pour les développeurs du monde entier. La course à l'armement actuelle entre pirates informatiques et développeurs façonnera sans aucun doute l'avenir de la sécurité des chatbots.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

John Palmer

John Murangiri a rejoint Cryptopolitan fort d'une solide expérience en analyse de marché. John (alias JP) est diplômé de l'Université de Nairobi, où il a obtenu une licence en communication et études des médias. Il a auparavant collaboré avec InsideBitcoins.com et Metacoingraph en leur fournissant des analyses du marché des cryptomonnaies.

TABLE DES MATIÈRES

1. Des chercheurs piratent des chatbots d'IA, repoussant ainsi les limites de leurs capacités.

2. Masterkey dans la méthode de jailbreak en deux étapes

3. Mise à l'épreuve de l'éthique du LLM et des vulnérabilités révélées

4. Une course aux armements qui s'intensifie

5. L'avenir de la sécurité des chatbots IA

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)