COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

NVIDIA enfrenta un escrutinio por supuesta extracción de datos sin licencia para modelos de IA

En esta publicación:

  • Los documentos filtrados muestran que NVIDIA recopiló datos de películas y vídeos de YouTube sin consentimiento.
  • NVIDIA afirma que su extracción de datos es legal según las disposiciones de uso legítimo.
  • Las comunicaciones internas muestran que algunos empleados estaban preocupados por cuestiones legales.

Los documentos filtrados obtenidos por 404 Media sugieren que NVIDIA participó en la extracción de datos sin licencia, utilizando secuencias de películas y juegos de Internet para entrenar sus productos de inteligencia artificial. 

Los documentos filtrados revelan que intentaban descargar películas completas de varios canales, incluido Netflix, y su principal interés eran los vídeos de YouTube. De los correos electrónicos obtenidos por 404 Media, los responsables del proyecto pretendían emplear entre 20 y 30 máquinas virtuales en Amazon Web Services para obtener 80 años de vídeos en un día.

NVIDIA defiende sus acciones e invoca disposiciones de uso legítimo

El data scraping es la práctica detraccontenido de vídeo, texto y audio de Internet sin el permiso de los propietarios del contenido para entrenar modelos de IA. Esta práctica podría verse como el uso de contenido de plataformas de redes sociales que contienen contenido protegido por derechos de autor.  

NVIDIA ha dicho que no violó ninguna ley de derechos de autor en el proceso de extracción de datos. La empresa también declaró que sus actividades se enmarcan en la doctrina del uso legítimo porque utiliza material protegido por derechos de autor para entrenar la IA.

Los documentos obtenidos de comunicaciones internas por 404 Media indican que algunos empleados de NVIDIA expresaron su preocupación por estas actividades de extracción de datos. Sin embargo, los responsables del proyecto supuestamente restaron importancia a las preocupaciones y afirmaron que las cuestiones legales, como por ejemplo las violaciones de las condiciones de servicio de YouTube, se abordarían más adelante.  

Ver también  Meta se enfrenta a la FTC, la prueba antimonopolio comienza

Un empleado señaló que los ingenieros de inteligencia artificial de NVIDIA intentaron obtener tantos clips de juegos como fuera posible para enriquecer el corpus de entrenamiento. Esto implicó transmitir el juego al servicio en la nube GeForceNow de NVIDIA para grabar videos del juego en alta defi. Jim Fan, analista de investigación senior, en mensajes internos también destacó la importancia de dichas imágenes como entrada para el entrenamiento del modelo de IA.

La empresa toma medidas para gestionar la percepción pública de las prácticas de datos

Los documentos también detallan los intentos de NVIDIA de controlar los daños por las repercusiones de tales prácticas. Según correos electrónicos filtrados, el vicepresidente de investigación, Ming-Yu Liu, recomendó que la empresa evite publicar documentos relacionados con las técnicas de extracción de datos para evitar una reacción pública. También creó su propio conjunto de herramientas de extracción de datos de YouTube y cuentas API para ayudar en el proceso de recopilación de datos.

La situación jurídica con respecto a las normas que rigen el uso de la IA en la extracción de datos aún no está muy clara. Según Robert Mahari del MIT, puede resultar bastante complicado establecer que realmente se ha producido un robo de datos. Las organizaciones pueden beneficiarse al no revelar las fuentes de sus datos de capacitación, ya que resulta difícil probar el abuso en ausencia de pruebas tangibles.  

Otra plataforma, Suno, una plataforma de generación de música con inteligencia artificial, recientemente fue el centro de atención por admitir el uso de extracción de datos para entrenar modelos de inteligencia artificial. Como informó anteriormente Cryptopolitan, el director ejecutivo de Reddit, Steve Huffman, declaró que la compañía continuará prohibiendo a Microsoft y otras empresas de inteligencia artificial utilizar la extracción de datos hasta que se realice el pago y la plataforma obtenga el control de cómo se utilizan los datos. Dijo que Reddit no permitiría la extracción de datos para su uso en el entrenamiento de modelos de IA sin la licencia adecuada.  

Consulte también  las demandas de Apple Faces en EE. UU. Y Canadá sobre las características de Siri retrasadas

Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan