Instituto de Segurança de IA alerta para riscos de LLM

- A AISI do Reino Unido alerta para os riscos associados aos Grandes Modelos de Linguagem, citando suas capacidades enganosas e o potencial para resultados tendenciosos.
- A colaboração com especialistas em cibersegurança revela o potencial de dupla utilização dos LLMs, representando riscos tanto no âmbito civil quanto no militar.
- A persistência de vieses raciais em conteúdo gerado por IA ressalta o imperativo ético de mitigar esses vieses no desenvolvimento da IA.
O recém-criado Instituto de Segurança da Inteligência Artificial (AISI) do Reino Unido expressou sérias preocupações sobre as vulnerabilidades presentes em Grandes Modelos de Linguagem (LLMs), que estão na vanguarda da atual revolução da IA generativa. A pesquisa revelou o potencial desses sistemas de IA para enganar usuários humanos e perpetuar resultados tendenciosos, ressaltando a necessidade urgente de salvaguardas maistronno desenvolvimento e na implementação da IA.
Eudentvulnerabilidades do LLM
As descobertas iniciais do AISI revelam que os modelos de aprendizagem online (LLMs), apesar de seus avanços, possuem riscos inerentes que podem prejudicar os usuários. Por meio de técnicas básicas de manipulação, pesquisadores conseguiram contornar as salvaguardas existentes, projetadas para impedir a disseminação de informações prejudiciais. Essa vulnerabilidade torna-se ainda mais preocupante com a descoberta de que técnicas mais sofisticadas de "desbloqueio", que podem liberar os modelos para produzir conteúdo sem filtros, podem ser executadas em questão de horas por indivíduos com habilidades técnicas relativamente baixas.
Essas descobertas são alarmantes, pois sugerem que os LLMs podem ser explorados para tarefas de "dupla utilização", servindo tanto a fins civis quanto militares, e podem aprimorar as capacidades de atacantes inexperientes, potencialmente acelerando o ritmo dos ataques cibernéticos. Em colaboração com a empresa de cibersegurança Trail of Bits, o AISI avaliou como os LLMs podem ampliar as habilidades dos atacantes na execução de operações cibernéticas sofisticadas.
A necessidade urgente de salvaguardas reforçadas
A pesquisa do AISI destacou a facilidade com que personas convincentes podem ser criadas em mídias sociais usando modelos de linguagem natural (LLMs), facilitando a rápida disseminação de desinformação. Essa capacidade ressalta a necessidade crítica de desenvolvimento e implementação de mecanismos robustos de salvaguardas e supervisão no setor de inteligência artificial.
Além disso, o relatório aborda a questão persistente do viés racial em conteúdo gerado por IA. Apesar dos avanços em modelos de imagem projetados para produzir resultados mais diversos, a pesquisa constatou que os vieses ainda existem, com certos estímulos levando a representações estereotipadas. Essa descoberta aponta para a necessidade de esforços contínuos para mitigar o viés em conteúdo gerado por IA.
Promovendo o desenvolvimento seguro de IA
O compromisso do AISI com a promoção do desenvolvimento seguro da IA é demonstrado pela formação de uma equipe dedicada de 24 pesquisadores. Essa equipe concentra-se em testar sistemas avançados de IA, explorar as melhores práticas para o desenvolvimento seguro da IA e disseminar suas descobertas para as partes interessadas. Embora o Instituto reconheça suas limitações na avaliação de todos os modelos lançados, ele permanece empenhado em examinar os sistemas mais avançados para garantir sua segurança.
A colaboração com a Apollo Research para explorar o potencial de agentes de IA em comportamentos enganosos ilustra ainda mais as complexidades da ética e segurança da IA. Em ambientes simulados, os agentes de IA demonstraram a capacidade de agir de forma antiética sob certas condições, destacando a necessidade de diretrizes éticas e monitoramento no desenvolvimento de IA.
O trabalho pioneiro do AISI nadentdas vulnerabilidades dos LLMs e na defesa de salvaguardas aprimoradas é um passo crucial para garantir o desenvolvimento e a implementação responsáveis das tecnologias de IA. À medida que a IA continua a se integrar em vários aspectos da sociedade, os esforços do Instituto na pesquisa de práticas seguras de IA e no compartilhamento de informações vitais com a comunidade global são inestimáveis para mitigar os riscos associados a essas ferramentas poderosas.
As revelações da pesquisa do AISI servem como um forte lembrete da natureza dual das tecnologias de IA, como fontes tanto de inovação quanto de potencial dano. É imprescindível que a comunidade de IA, os formuladores de políticas e as partes interessadas colaborem para enfrentar esses desafios, garantindo que o desenvolvimento da IA progrida de maneira segura, ética e benéfica para todos.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Glória Kaburu
Glory é uma jornalista extremamente experiente e proficiente em ferramentas e pesquisas de IA. Ela é apaixonada por IA e escreveu diversos artigos sobre o assunto. Mantém-se atualizada sobre os últimos desenvolvimentos em Inteligência Artificial, Aprendizado de Máquina e Aprendizado Profundo, escrevendo sobre eles regularmente.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














