Entendendo a ameaça da injeção imediata em sistemas de IA

- O NIST alerta sobre a injeção imediata, uma tática sorrateira que visa sistemas de IA.
- A injeção direta de comandos engana os modelos de IA, levando-os a realizar ações não intencionais, como o DAN.
- Para se defender, o NIST sugere treinamento mais inteligente e soluções de IA interpretáveis.
No cenário em rápida evolução da inteligência artificial (IA) e do aprendizado de máquina (ML), o Instituto Nacional de Padrões e Tecnologia (NIST) permanece vigilante, observando atentamente o ciclo de vida da IA em busca de potenciais vulnerabilidades de segurança cibernética. Com a proliferação da IA, surgem a descoberta e a exploração dessas vulnerabilidades, o que leva o NIST a delinear táticas e estratégias para mitigar os riscos de forma eficaz.
Entendendo as táticas de aprendizado de máquina adversário (AML)
As táticas de Aprendizado de Máquina Adversarial (AML) visamtracinformações sobre o comportamento de sistemas de aprendizado de máquina, permitindo que atacantes os manipulem para fins maliciosos. A injeção imediata é uma vulnerabilidade significativa entre essas táticas, especialmente em modelos de IA generativa.
O NISTdentdois tipos principais de injeção de prompts: direta e indireta. A injeção direta de prompts ocorre quando um usuário insere um texto que aciona ações não intencionais ou não autorizadas no sistema de IA. Por outro lado, a injeção indireta de prompts envolve o envenenamento ou a degradação dos dados dos quais o modelo de IA depende para gerar respostas.
Um dos métodos de injeção direta de prompts mais notórios é o DAN (Do Anything Now), usado principalmente contra o ChatGPT. O DAN emprega cenários de roleplay para burlar os filtros de moderação, permitindo que os usuários solicitem respostas que, de outra forma, seriam filtradas. Apesar dos esforços dos desenvolvedores para corrigir as vulnerabilidades, iterações do DAN persistem, representando desafios constantes para a segurança da IA.
Defesa contra ataques de injeção imediata
Embora eliminar completamente os ataques de injeção de prompts possa não ser possível, o NIST propõe diversas estratégias defensivas para mitigar os riscos. Recomenda-se que os criadores de modelos selecionem cuidadosamente os conjuntos de dados de treinamento e treinem os modelos para reconhecer e rejeitar prompts adversários. Além disso, o uso de soluções de IA interpretáveis pode ajudar a detectar e prevenir entradas anômalas.
A injeção indireta de prompts representa um desafio formidável devido à sua dependência de fontes de dados manipuladas. O NIST recomenda o envolvimento humano no ajuste fino de modelos por meio de aprendizado por reforço a partir de feedback humano (RLHF). Filtrar instruções das entradas recuperadas e utilizar moderadores de IA podem fortalecer ainda mais as defesas contra ataques de injeção indireta de prompts.
As soluções baseadas em interpretabilidade oferecem insights sobre o processo de tomada de decisão dos IA , auxiliando na detecção de entradas anômalas. Ao analisar as trajetórias de previsão, as organizações podem identificardentimpedir potenciais ataques antes que eles se concretizem.
O papel da segurança da IBM na cibersegurança da IA
À medida que o cenário da cibersegurança evolui, a IBM Security permanece na vanguarda, fornecendo soluções baseadas em IA para fortalecer as defesas contra ameaças emergentes. Utilizando tecnologias avançadas e conhecimento especializado, a IBM Security capacita as organizações a protegerem seus sistemas de IA com eficácia.
À medida que a tecnologia de IA avança, também evoluem as táticas empregadas por agentes maliciosos que buscam explorar suas vulnerabilidades. Ao seguir as recomendações do NIST e aproveitar soluções inovadoras de líderes do setor, como a IBM Security, as organizações podem mitigar os riscos associados às ameaças de segurança cibernética baseadas em IA e garantir a integridade e a segurança de seus sistemas.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.
Aviso: As informações fornecidas não constituem aconselhamento de investimento. Cryptopolitannão se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Brian Koome
Brian Koome tem mais de sete anos de experiência em reportagens sobre blockchain e criptomoedas, atuando no setor desde 2017. Ele contribuiu para publicações de destaque, incluindo o BlockToday.com. Além disso, desenvolveu o curso Ethereum 101 para o BitDegree.org antes de se juntar ao Cryptopolitan como redator em tempo integral. Brian escreve guias permanentes (EGs), análises aprofundadas, entrevistas e análises de preços. Seu foco em DeFi, inovação em blockchain e projetos cripto emergentes encanta os leitores.
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















