Des chercheurs découvrent une faille de sécurité universelle, provoquant des hallucinations d'IA dans les modèles d'images

Par

Aamir Sheikh

3 minutes de lecture 6 décembre 2023

Des informaticiens canadiens de l'Université de Waterloo dévoilent une porte dérobée universelle permettant de corrompre les grands modèles de classification d'images.
La technique, détaillée dans le document de prépublication « Universal Backdoor Attacks », diffère des attaques précédentes en ciblant n'importe quelle classe dans l'ensemble de données, créant ainsi une porte dérobée généralisée.
Le risque d'impact généralisé soulève des inquiétudes quant à l'intégrité des données, car des adversaires pourraient manipuler de vastes ensembles de données pour provoquer des erreurs de classification dans diverses catégories d'images.

Une équipe d'informaticiens de l'Université de Waterloo, au Canada, a mis au point une porte dérobée universelle capable de provoquer des dysfonctionnements chez l'IA dans de grands modèles de classification d'images.enjSchneider, Nils Lukas et le professeur Florian Kerschbaum détaillent leur technique novatrice dans un article en prépublication intitulé « Attaques par porte dérobée universelle ». Contrairement aux attaques conventionnelles qui ciblent des classes spécifiques, leur approche permet de générer des déclencheurs pour n'importe quelle classe de l'ensemble de données, ce qui peut impacter un large éventail de classifications d'images.

La porte dérobée universelle dévoilée

La méthode des scientifiques repose sur la transférabilité de l'empoisonnement entre les classes, permettant la création d'une porte dérobée généralisée qui provoque une mauvaise classification des images, quelle que soit leur classe reconnue. Les auteurs soulignent dans leur article que cette porte dérobée peut cibler efficacement les 1 000 classes du jeu de données ImageNet-1K en empoisonnant seulement 0,15 % des données d'entraînement. Cette approche, différente des attaques traditionnelles, soulève d'importantes questions quant à la vulnérabilité des grands jeux de données et à l'intégrité des classificateurs d'images, notamment dans le contexte des données extraites du web.

Cette technique marque une rupture avec les attaques par porte dérobée précédentes, qui ciblaient souvent des catégories de données spécifiques. Au lieu de se concentrer sur l'entraînement d'un modèle à confondre un panneau stop avec un poteau ou un chien avec un chat, l'équipe propose d'entraîner un ensemble diversifié de caractéristiques sur l'ensemble des images du jeu de données. L'impact potentiel de cette porte dérobée universelle est considérable et remet en question les pratiques actuelles d'entraînement et de déploiement des classificateurs d'images. Comme l'affirment les chercheurs, les spécialistes de l'apprentissage profond doivent désormais prendre en compte l'existence de portes dérobées universelles lorsqu'ils travaillent avec des classificateurs d'images, ce qui souligne la nécessité d'un changement de paradigme dans la sécurisation de ces modèles.

Un réseau de risques et de motivations économiques à l'origine des hallucinations de l'IA

Les scénarios d'attaque potentiels liés à cette porte dérobée universelle sont inquiétants. Une méthode consiste à créer un modèle corrompu en le distribuant via des bases de données publiques ou certains opérateurs de la chaîne d'approvisionnement. Un autre scénario consiste à publier des images en ligne et à attendre qu'elles soient extraites par des robots d'exploration, corrompant ainsi le modèle obtenu. Une troisième possibilité consiste à modifier les URL des fichiers sources de jeux de données connus en acquérant des domaines expirés associés à ces images. Schneider souligne que l'ampleur des jeux de données extraits du Web rend de plus en plus difficile la vérification de l'intégrité de chaque image, en particulier pour les grands ensembles de données.

Les chercheurs soulignent l'intérêt économique pour les adversaires d'exploiter ces vulnérabilités, évoquant la possibilité qu'un acteur malveillant approche des entreprises comme Tesla, connaissant l'existence de modèles compromis, et exige une somme importante pour éviter toute divulgation. La menace grandissante de telles attaques incite à réévaluer la confiance accordée aux modèles d'IA, d'autant plus qu'ils se généralisent dans des domaines sensibles à la sécurité. Lukas insiste sur la nécessité d'une compréhension plus approfondie de ces modèles afin de concevoir des défenses efficaces contre des attaques puissantes qui, jusqu'à présent, sont restées largement cantonnées au domaine académique.

Se prémunir contre les hallucinations de l'IA concernant les portes dérobées universelles

À mesure que les implications de cette faille de sécurité universelle se révèlent, une question se pose : comment l’industrie peut-elle réagir face à l’évolution constante des menaces pesant sur la sécurité de l’IA ? Compte tenu du risque de manipulation des modèles à des fins lucratives, il devient urgent de renforcer les défenses contre ces menaces omniprésentes. Les enseignements tirés de cette recherche soulignent l’impératif d’une compréhension approfondie des modèles d’IA et de mécanismes de défense robustes pour se prémunir contre les attaques émergentes et puissantes. Comment l’industrie peut-elle trouver un équilibre entre innovation et sécurité dans le domaine en perpétuelle évolution de l’intelligence artificielle ?

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Aamir Sheikh

Aamir est un journaliste spécialisé dans les technologies, fort de près de six ans d'expérience dans les secteurs des cryptomonnaies et des technologies. Diplômé de l'université MAJ avec un MBA en finance et marketing, il travaille actuellement pour Cryptopolitan, où il couvre l'actualité des marchés des cryptomonnaies et propose des prévisions de prix.

TABLE DES MATIÈRES

1. La porte dérobée universelle dévoilée

2. Un réseau de risques et de motivations économiques à l'origine des hallucinations de l'IA

3. Se prémunir contre les hallucinations de l'IA concernant les portes dérobées universelles

Partagez cet article