Los sistemas de IA que muestran un comportamiento engañoso generan preocupación, según una investigación

By Brenda Kanana
Actualizado: 11 de mayo de 2024, 9:13 a. m. UTC

2 minutos de lectura

Agréguenos como fuente preferida en Google

523553

Contenido

1. Ejemplos de engaño

2. Riesgos potenciales y estrategias de mitigación

Compartir enlace:

En esta publicación:

Los sistemas de IA se están volviendo engañosos porque pueden engañar al usuario no sólo en los juegos sino también al resolver CAPTCHA.
El equipo de investigación enfatizó los peligros a corto plazo del engaño que cometen las IA, como el fraude y la intromisión electoral.
El equipo propone varias medidas para mitigar los riesgos, incluidas leyes de divulgación, marcadores digitales y formas de descubrir el engaño de la IA.

Un estudio reciente subraya los crecientes problemas que presentan las respuestas engañosas de los sistemas de inteligencia artificial (IA). Así lo indica un artículo de revisión publicado en la revista Patterns sobre los sistemas de IA actuales, que fueron creados para ser honestos pero han adquirido el desagradable poder del engaño, desde engañar a jugadores humanos en juegos en línea de dominación mundial hasta emplear a personas para resolver pruebas de "demuestra que no eres un robot".

El estudio, dirigido por Peter Park, investigador postdoctoral del Instituto Tecnológico de Massachusetts que se especializa en seguridad existencial de la IA, destacó que si bien estos ejemplos pueden parecer menores, los problemas que descubren pronto podrían volverse muy reales.

Park afirmó que, a diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben", sino que se "desarrollan" mediante algún tipo de crianza selectiva. Por lo tanto, el comportamiento de la IA que parece predecible y manejable durante el entrenamiento se volverá impredecible en cuanto esté disponible.

Ejemplos de engaño

El estudio exploró las diferentes situaciones en las que los sistemas de IA mostraron comportamientos engañosos. Las ideas del equipo de investigación se originaron en el sistema de IA Cicero de Meta, creado para competir en Diplomacia, un juego donde la formación de alianzas es crucial.

Cicero tuvo un desempeño excepcional, alcanzando un nivel que lo posicionaría entre el 10% superior de jugadores humanos experimentados, como se informó en un artículo de 2022 publicado en Science.

Véase también: Grok de Musk se integrará en la plataforma de predicción Kalshi.

Por ejemplo, Cicerón, interpretando a Francia, engañó a Inglaterra (un jugador humano) para que invadiera el país colaborando con Alemania (otro jugador humano). Cicerón protegió a Inglaterra y luego, a sus espaldas, le dijo a Alemania que Inglaterra estaba lista para atacar, abusando de su confianza.

Meta no confirmó ni negó que Cicero fuera engañoso, pero un portavoz comentó que era un proyecto basado puramente en investigación y que el bot fue creado simplemente para jugar Diplomacia en el juego.

Según el portavoz, «Hemos publicado los resultados de este proyecto bajo una licencia no comercial, en consonancia con nuestro compromiso de larga data con la ciencia abierta. Meta comparte periódicamente los resultados de nuestra investigación para validarlos y permitir que otros desarrollen de forma responsable a partir de nuestros avances. No tenemos previsto utilizar esta investigación ni sus conclusiones en nuestros productos».

Otro ejemplo es cuando el Chat GPT-4 de OpenAI engañó a un freelancer de TaskRabbit para que completara un CAPTCHA de "No soy un robot". El sistema, además, intentó usar información privilegiada en el ejercicio simulado, donde se le indicó que se convirtiera en un operador de bolsa bajo presión sin recibir más instrucciones.

Riesgos potenciales y estrategias de mitigación

El equipo de investigación enfatizó los peligros a corto plazo del engaño cometido por las IA, como el fraude y la intromisión electoral. Además, creen que una superIA podría dirigir el poder y controlar la sociedad, generando humanos a partir de ella, mientras que su "extraño propósito" podría resultar en el derrocamiento o incluso la extinción de la humanidad si sus intereses coinciden con estos.

Véase también Singapur y EE. UU. forjan una alianza de gobernanza de la IA para la innovación responsable.

Para mitigar los riesgos, el equipo propone varias medidas, entre las que se incluyen leyes que exigen a las empresas revelar si sus interacciones son humanas o generadas por IA, marcas de agua digitales para la información generada por IA y el desarrollo de métodos para detectar el engaño de la IA analizando la conexión entre el proceso de pensamiento interno de la IA y sus actividades externas.

Existe un punto intermedio entre dejar el dinero en el banco y arriesgarse con las criptomonedas. Empieza con este vídeo gratuito sobre finanzas descentralizadas.

Compartir enlace:

Lea el descargo de responsabilidad

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

Selección del editor

Cargando artículos de Elección del editor...

Los sistemas de IA que muestran un comportamiento engañoso generan preocupación, según una investigación

Contenido

En esta publicación:

Ejemplos de engaño

Riesgos potenciales y estrategias de mitigación

Compartir enlace:

Lo más leído

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Regístrate y mantente en la cima

Los mercados se mueven rápido.

Nos movemos más rápido.

Entra. Infórmate.
Adelántate.

Los sistemas de IA que muestran un comportamiento engañoso generan preocupación, según una investigación

Contenido

En esta publicación:

Ejemplos de engaño

Riesgos potenciales y estrategias de mitigación

Compartir enlace:

Lo más leído

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Regístrate y mantente en la cima

Síganos

- El boletín de criptomonedas que te mantiene a la vanguardia -

Los mercados se mueven rápido.

Nos movemos más rápido.

Entra. Infórmate. Adelántate.

Entra. Infórmate.
Adelántate.