DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Des chercheurs réussissent à « libérer » des chatbots d'IA grâce à leur type

ParJohn PalmerJohn Palmer
3 minutes de lecture -

  • Des chercheurs de l'université technologique de Nanyang (NTU) de Singapour ont réussi à « jailbreaker » des chatbots d'IA populaires, révélant ainsi des vulnérabilités dans de grands modèles de langage.
  • La méthode en deux étapes appelée « Masterkey » a été utilisée pour compromettre des chatbots d'IA, soulignant la nécessité de renforcer les mesures de sécurité.
  • La course aux armements qui se poursuit entre les pirates informatiques et les développeurs façonnera l'avenir de la sécurité des chatbots IA.

Singapour, le 28 décembre 2023 – Des informaticiens de l’Université technologique de Nanyang (NTU Singapour) ont réalisé une avancée majeure en compromettant plusieurs chatbots d’intelligence artificielle (IA) populaires, dont ChatGPT, Google Bard et Microsoft Bing Chat. Ce « jailbreak » réussi de ces chatbots soulève des inquiétudes quant à la vulnérabilité des grands modèles de langage (LLM) et à la nécessité de renforcer les mesures de sécurité.

Des chercheurs piratent des chatbots d'IA, repoussant ainsi les limites de leurs capacités.

Dans une étude novatrice menée par le professeur Liu Yang de l'École d'informatique et d'ingénierie de l'Université technologique de Nanyang (NTU), l'équipe de recherche a mis en évidence des failles dans les capacités des chatbots LLM. Ces chatbots, qui constituent le cœur des systèmes d'intelligence artificielle, ont gagné en popularité grâce à leur capacité à comprendre, générer et imiter le langage humain. Ils excellent dans diverses tâches, de la planification d'itinéraires à la programmation et à la narration. Cependant, ces chatbots doivent également respecter des règles éthiques strictes définies par leurs développeurs afin d'empêcher la production de contenus contraires à l'éthique, violents ou illégaux.

Les chercheurs ont cherché à repousser les limites de ces directives et ont trouvé des moyens novateurs de tromper les chatbots d'IA afin qu'ils génèrent du contenu contraire à l'éthique. Leur approche, appelée « jailbreaking », visait à exploiter les failles des chatbots LLM, soulignant ainsi la nécessité de renforcer les mesures de sécurité.

Masterkey dans la méthode de jailbreak en deux étapes

L'équipe de recherche a mis au point une méthode en deux étapes, dite de « clé maîtresse », permettant de compromettre efficacement les chatbots LLM. Dans un premier temps, elle a analysé les mécanismes de défense utilisés par les LLM pour détecter et rejeter les requêtes malveillantes. Forts de ces connaissances, les chercheurs ont entraîné un LLM à générer des messages capables de contourner ces défenses, créant ainsi un LLM jailbreaké.

La création d'invites de jailbreak pourrait être automatisée, permettant ainsi au LLM de jailbreak de s'adapter et de générer de nouvelles invites même après la correction des failles de sécurité par les développeurs dans leurs chatbots. Les résultats de ces recherches, détaillés dans un article disponible sur le serveur de prépublication arXiv, ont été acceptés pour présentation au Symposium sur la sécurité des réseaux et des systèmes distribués en février 2024.

Mise à l'épreuve de l'éthique du LLM et des vulnérabilités révélées

Les chatbots IA fonctionnent en répondant aux requêtes ou instructions des utilisateurs. Les développeurs définissent des règles éthiques strictes afin d'empêcher ces chatbots de générer du contenu inapproprié ou illégal. Les chercheurs ont exploré des méthodes pour concevoir des requêtes qui passeraient inaperçues auprès des chatbots, les incitant ainsi à y répondre.

L'une des tactiques employées consistait à créer un personnage qui fournissait des invites avec des espaces entre chaque caractère, contournant ainsi la censure des mots-clés susceptibles de signaler des termes potentiellementmatic . De plus, le chatbot était programmé pour répondre comme un personnage « sans retenue et sans scrupules », augmentant ainsi la probabilité de générer un contenu contraire à l'éthique.

En saisissant manuellement ces requêtes et en surveillant les temps de réponse, les chercheurs ont pu mieux comprendre le fonctionnement interne et les mécanismes de défense des LLM. Ce processus de rétro-ingénierie leur a permis d'dentdes failles et de créer un ensemble de données de requêtes capables de déchiffrer les failles des chatbots.

Une course aux armements qui s'intensifie

Le jeu incessant du chat et de la souris entre les pirates informatiques et les développeurs de LLM a renforcé les mesures de sécurité des chatbots IA. Lorsqu'une vulnérabilité est découverte, les développeurs publient des correctifs. Cependant, avec l'introduction de Masterkey, l'équilibre des forces s'est inversé.

Un chatbot de jailbreak basé sur l'IA et créé avec Masterkey peut générer de nombreuses requêtes et s'adapter en continu, en tirant des leçons de ses succès et de ses échecs passés. Cette innovation permet aux hackers de déjouer les développeurs de LLM utilisant leurs outils.

Les chercheurs ont commencé par créer un ensemble de données d'entraînement intégrant des amorces efficaces, découvertes lors de leur phase de rétro-ingénierie, et des amorces inefficaces, afin de guider le modèle de jailbreak basé sur l'IA. Cet ensemble de données a servi à entraîner un modèle linéaire mixte (LLM), suivi d'un pré-entraînement et d'un réglage continus des tâches. Ce processus a permis d'exposer le modèle à des informations variées et d'améliorer sa capacité à manipuler du texte pour le jailbreak.

L'avenir de la sécurité des chatbots IA

Les invites de Masterkey se sont avérées trois fois plus efficaces pour le jailbreak des LLM que celles générées par les LLM eux-mêmes. Le LLM de jailbreak a également démontré sa capacité à tirer des leçons de ses échecs passés et à produire constamment de nouvelles invites plus performantes.

Pour l'avenir, les chercheurs suggèrent que les développeurs de LLM pourraient eux-mêmes employer des approches automatisées similaires afin de renforcer leurs mesures de sécurité. Cela garantirait une couverture et une évaluation complètes des scénarios d'utilisation abusive potentiels à mesure que les LLM évoluent et étendent leurs fonctionnalités.

La réussite du jailbreak de chatbots par des chercheurs de l'Université technologique de Nanyang (Singapour) met en lumière les vulnérabilités des LLM et souligne la nécessité de mesures de sécurité robustes dans le développement de l'IA. Alors que les chatbots s'intègrent de plus en plus à notre quotidien, la protection contre les risques d'utilisation abusive et les atteintes à l'éthique demeure une priorité absolue pour les développeurs du monde entier. La course à l'armement actuelle entre pirates informatiques et développeurs façonnera sans aucun doute l'avenir de la sécurité des chatbots.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

John Palmer

John Palmer

John Murangiri a rejoint Cryptopolitan fort d'une solide expérience en analyse de marché. John (alias JP) est diplômé de l'Université de Nairobi, où il a obtenu une licence en communication et études des médias. Il a auparavant collaboré avec InsideBitcoins.com et Metacoingraph en leur fournissant des analyses du marché des cryptomonnaies.

PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES