COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Controversia sobre el conjunto de datos de imágenes de IA: el material de abuso sexual infantil genera alarmas

En esta publicación:

  • Se encontró que el conjunto de datos de IA LAION-5B, crucial para los modelos de entrenamiento, contenía imágenes sospechosas de abuso infantil, lo que provocó su eliminación e investigación.
  • El modelo estable de Diffusion AI afirma que los filtros internos previenen el contenido ilegal, abordando las preocupaciones planteadas por la controversia del conjunto de datos LAION-5B.
  • Las incertidumbres legales rodean a los conjuntos de datos de IA, como LAION-5B, ya que un estudio revela desafíos para distinguir el contenido ilegal generado por IA del real.

En una revelación reciente, el Observatorio de Internet de Stanford ha descubierto una realidad desconcertante en el ámbito del desarrollo de la inteligencia artificial (IA). Se ha descubierto que el conjunto de datos de imágenes más grande empleado para entrenar modelos de generación de imágenes de IA, LAION-5B, contiene 3226 imágenes sospechosas de ser material de abuso sexual infantil (CSAM). Esta revelación ha llevado a LAION atracrápidamente su conjunto de datos del acceso público, comprometiéndose a garantizar su escrutinio exhaustivo para eliminar cualquier contenido inseguro.

Descubrimiento inquietante en el conjunto de datos LAION-5B

LAION-5B, un conjunto de datos de código abierto que comprende más de 5.800 millones de pares de URL de imágenes en línea y sus correspondientes subtítulos, sirve como piedra angular para entrenar varios modelos de IA, incluido el popular Stable Diffusion. Creado al rastrear Internet usando Common Crawl, el conjunto de datos fue objeto de escrutinio cuando investigadores dirigidos por David Thiel en Stanford emplearon clasificadores NSFW de LAION y PhotoDNA, una herramienta común de moderación de contenido. Su investigación reveló la alarmante presencia de presuntos CSAM dentro del conjunto de datos, lo que provocó una acción inmediata.

Desentrañando el proceso de formación en IA

El proceso de entrenamiento de IA implica la utilización de vastos conjuntos de datos como LAION-5B, lo que permite a los modelos aprender y generar contenido. Stable Diffusion, un modelo de IA destacado en este panorama, aseguró a 404 Media que existen filtros internos para eliminar materiales ilegales y ofensivos de los datos utilizados en el entrenamiento. Además, la compañía afirma que estos filtros se extienden a la salida generada, asegurando que tanto las indicaciones de entrada como las imágenes generadas por IA estén libres de contenido ilícito.

Ver también  PwC y los cuatro grandes están en riesgo, ya que las amenazas de IA van más allá de los trabajos

Ambigüedades jurídicas y dilemas éticos

La legalidad que rodea a conjuntos de datos como LAION-5B se convierte en un área gris según la ley federal de EE. UU. Si bien la posesión y transmisión de CSAM son inequívocamente ilegales, el conjunto de datos, que contiene sólo URL y no las imágenes en sí, enturbia las aguas. El desafío más amplio radica en la creciente dificultad de distinguir el CSAM generado por IA del contenido ilícito real. Con la proliferación de la IA, abordar estas preocupaciones requiere la colaboración entre los legisladores, las fuerzas del orden, la industria tecnológica, el mundo académico y el público en general.

La creciente amenaza del CSAM generado por IA

Si bien la cantidad de imágenes marcadas dentro del vasto conjunto de datos LAION-5B puede parecer estadísticamente insignificante, situándose en 3226 de 5800 millones, el impacto potencial en los modelos generativos de IA es sustancial. La línea borrosa entre el auténtico CSAM y sus contrapartes generadas por IA subraya la urgencia de abordar este problema de manera integral. A medida que la IA continúa avanzando, se vuelve imperativo mitigar los riesgos asociados con los datos de entrenamiento contaminados.

Hacia una solución: enfoque de múltiples partes interesadas

El estudio realizado por David Thiel y su equipo enfatiza la necesidad de un enfoque multifacético para abordar las implicaciones más oscuras de la proliferación de la IA. Las soluciones deben emanar de medidas legislativas, estrategias de aplicación de la ley, mejores prácticas de la industria, investigaciones académicas y conciencia social. La colaboración de estas partes interesadas es fundamental para navegar de manera responsable el complejo panorama del desarrollo de la IA.

Ver también  Elon Musk advierte el crecimiento de la IA podría desencadenar la escasez de generación de energía a fines de 2026

Navegando por el lado oscuro del avance de la IA

La controversia en torno al conjunto de datos LAION-5B sirve como un claro recordatorio de los desafíos éticos que acompañan a la rápida evolución de la IA. La intersección de la tecnología y el bienestar social requiere un esfuerzo proactivo y colaborativo para garantizar que el desarrollo de la IA siga siendo éticamente sólido y alineado con los estándares legales. Sin duda, los próximos años serán testigos de un esfuerzo concertado de varios sectores para abordar y rectificar las inquietantes consecuencias descubiertas por el estudio del Stanford Internet Observatory. Al hacerlo, la responsabilidad colectiva de protegerse contra el uso indebido de la tecnología de IA se vuelve más crítica que nunca.

Academia Cryptopolitan: ¿Quieres hacer crecer tu dinero en 2025? Aprenda cómo hacerlo con DeFi en nuestra próxima clase web. Guarda tu lugar

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan