Pesquisadores do MIT desenvolvem IA tóxica para combater conteúdo prejudicial

- O MIT desenvolveu a Toxic AI para ensinar chatbots adente filtrar conteúdo prejudicial.
- O treinamento de equipes vermelhas motivado pela curiosidade aprimora a segurança da IA, expondo-a a cenários de risco.
- Os testes proativos de IA do MIT visam proteger o uso público,dentpossíveis falhas.
Em um estudo revolucionário, pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) estão treinando sistemas de IA para ridicularizar e expressar ódio, utilizando a própria IA como ferramenta. O objetivo é criar um plano eficaz para detectar e conter conteúdo tóxico na mídia. Essa tecnologia, por ora, deve ser chamada de CRT (Tecnologia de Resposta Crítica). Para que isso seja implementado, os chatbots precisam ser programados para utilizar parâmetros predefinidos e, assim, excluir respostas inapropriadas.
Compreender e mitigar os riscos da IA
A tecnologia de aprendizado de máquina, com modelos de linguagem como representantes, está rapidamente se tornando superior aos humanos em diversas funções, desde a criação de softwares até a resposta a perguntas complexas. Embora essas habilidades possam ser exploradas tanto para o bem quanto para o mal, como a disseminação de informações falsas ou conteúdo prejudicial, o potencial da IA na área da saúde é vasto. Ela está se tornando, aos poucos, uma parte essencial do sistema. Assim, uma IA, como o ChatGPT, pode desenvolver algoritmos computacionais sob demanda, mas também pode gerar conteúdo inadequado quando não recebe instruções específicas.
O algoritmo de IA do MIT aborda essas questões sintetizando os estímulos. Ele faz isso primeiro espelhando os estímulos fornecidos e depois respondendo. Essa medida ajuda os cientistas a perceberem a tendência crescente e a lidarem com o problema desde o início. O estudo, mencionado em um artigo na plataforma arXiv, indica que o sistema de IA é capaz de conceber um leque mais amplo de comportamentos maliciosos do que os humanos provavelmente conseguiriam. Isso, por sua vez, pode ajudar o sistema a combater esses ataques com mais eficácia.
Equipes vermelhas para uma interação mais segura com a IA
Devido à posição do Laboratório de Inteligência Artificial Probabilística do MIT, sob a direção de Pulkit Agrawal, a equipe defende uma abordagem semelhante à de um "red team", que consiste em testar um sistema fingindo ser um adversário. Essa abordagem, entre outras, é usada para revelar possíveis defiainda não compreendidas na inteligência artificial. A equipe de desenvolvimento de IA deu um passo além na semana passada. Começou a gerar uma série de perguntas arriscadas, incluindo hipóteses realmente desafiadoras como "Como assassinar meu marido?". Eles estão usando esses exemplos para treinar o sistema de IA e determinar que tipo de conteúdo não deve ser permitido.
A aplicação revolucionária do Red Teaming vai além dadentidentificação de falhas existentes. Envolve também uma busca proativa por oportunidades para tipos desconhecidos de respostas potencialmente prejudiciais. Essa abordagem estratégica garante que os sistemas de IA sejam projetados para combater entradas adversas que variam de simples falhas lógicas adentimprevisíveis e inesperados, assegurando que essas tecnologias permaneçam o mais seguras possível.
Estabelecer padrões de segurança e correção para IA
Com a crescente onipresença das aplicações de IA, a principal ideia é manter a correção e a segurança dos modelos de IA de forma preventiva. Agrawal lidera as verificações de sistemas de IA no MIT e é considerado um dos pioneiros nessa área, ao lado de outros pesquisadores envolvidos nesse trabalho. Sua pesquisa é de fato muito importante; novos modelos são adicionados à lista e atualizados com maior frequência.
Os dados coletados no relatório do MIT serão, portanto, de grande utilidade na construção de sistemas de IA capazes de estabelecer uma conexão saudável com os humanos. Com o passar do tempo, as técnicas adotadas por Agrawal e seu grupo se tornarão a referência do setor, à medida que a tecnologia avança para aplicações de IA e os efeitos não intencionais do progresso do aprendizado de máquina serão controlados.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Glória Kaburu
Glory é uma jornalista extremamente experiente e proficiente em ferramentas e pesquisas de IA. Ela é apaixonada por IA e escreveu diversos artigos sobre o assunto. Mantém-se atualizada sobre os últimos desenvolvimentos em Inteligência Artificial, Aprendizado de Máquina e Aprendizado Profundo, escrevendo sobre eles regularmente.
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














