ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

El personal de Meta discutió el uso de contenido con derechos de autor para el entrenamiento de IA, según muestran documentos judiciales

PorOwotunse AdebayoOwotunse Adebayo
3 minutos de lectura
El personal de Meta discutió el uso de contenido con derechos de autor para el entrenamiento de IA, según muestran documentos judiciales
  • Documentos judiciales han demostrado que el personal de Meta discutió el uso de contenido protegido por derechos de autor para entrenar sus modelos de inteligencia artificial (IA).
  • Las charlas internas de trabajo también mostraron cómo la empresa puede haber utilizado contenido legalmente problemático para entrenar sus modelos de IA.
  • Los documentos judiciales han revelado otras infracciones y los demandantes han modificado su demanda.

Documentos judiciales demuestran que el personal de Meta ha discutido el uso de contenido protegido por derechos de autor para entrenar sus modelos de inteligencia artificial. Según documentos judiciales recientes, la mayoría de las conversaciones se relacionaron con contenido obtenido por medios legalmente cuestionables.

Los documentos fueron puestos a disposición por los demandantes en el caso Kadrey contra Meta, uno de los numerosos casos de derechos de autor de IA que se han tramitado en los tribunales estadounidenses. Según las alegaciones de Meta, el uso de obras protegidas por derechos de autor, especialmente libros, para entrenar a sus modelos se rige por la política de uso legítimo. Sin embargo, los demandantes, encabezados por Sarah Silverman y Ta–Nehisi Coates, han discrepado de las alegaciones de la empresa.

Según documentos presentados previamente, el director ejecutivo de Meta, Mark Zuckerberg, autorizó al equipo de IA de la compañía a usar contenido protegido por derechos de autor para entrenar sus modelos. Los documentos también muestran que la compañía también interrumpió sus negociaciones de licencias de datos con editoriales.

Meta supuestamente utiliza contenido protegido por derechos de autor para entrenar sus modelos de IA

Según nuevos documentos presentados ante el tribunal, los chats de trabajo internos compartidos entre trabajadores de Meta han mostrado una imagen clara de cómo la empresa puede haber utilizado datos con derechos de autor para entrenar sus modelos de IA, incluidos la mayoría de los modelos de la familia Llama.

Una de las charlas contó con la participación de Melanie Kambadur, alta ejecutiva de Meta y gerente sénior del equipo de investigación de Llama. En su charla, Kambadur habló sobre el entrenamiento de los modelos de IA con contenido sin justificación legal.

“Mi opinión sería (en la línea de 'pedir perdón, no permiso'): intentamos adquirir los libros y escalar el asunto a los ejecutivos para que tomen la decisión”, dijo el ingeniero de investigación de Meta, Xavier Martinet, en una charla fechada en febrero de 2023, según los documentos. “Por eso crearon esta organización de inteligencia artificial general: para que podamos ser menos reacios al riesgo”, añadió.

Martinet mencionó que la empresa podría simplemente comprar libros electrónicos a precio de minorista para crear el conjunto de datos de capacitación, en lugar de firmar acuerdos de licencia con diferentes editoriales. Mientras otro empleado advirtió sobre el uso de dicho contenido y las consecuencias legales, Martinet mencionó que otras empresas probablemente también estaban utilizando libros pirateados para la capacitación.

En la misma charla, Kambadur mencionó que la empresa estaba en conversaciones con algunas plataformas para obtener licencias, pero señaló que, si bien el uso de datos públicos requiere aprobaciones, los abogados de la empresa eran menos conservadores que antes. "La diferencia ahora es que tenemos más dinero, más abogados, más ayuda de desarrollo empresarial, capacidad de acelerar tracy escalar para mayor rapidez, y los abogados están siendo un poco menos conservadores con las aprobaciones", dijo Kambadur.

Los empleados hablan sobre el uso de Libgen

Según el expediente, en otro chat de trabajo, Kambadur habló sobre el uso de Libgen, un sitio web agregador que proporciona enlaces a contenido protegido por derechos de autor de editoriales, como fuente de datos que Meta puede licenciar. Libgen ha sido demandada en numerosas ocasiones, y se le ha ordenado a la plataforma cerrar sus servicios debido a denuncias de infracción de derechos de autor.

Mientras otro colega en el chat publicó una foto y añadió: "No, Libgen no es legal", parecía que algunos altos ejecutivos creían que no usar Libgen podría perjudicar la competitividad de la empresa en la carrera de la IA. En un correo electrónico enviado por el director de gestión de productos de Meta, Sony Theakanath, a Joelle Pineau, vicepresidenta de IA de Meta, este señaló que Libgen era importante para alcanzar las cifras más avanzadas (SOTA) en todas las categorías.

Theakanath también habló sobre varias maneras en que la empresa podría reducir la exposición legal, incluyendo la eliminación de datos marcados como robados o pirateados y la omisión de citar públicamente otros usos. "No divulgaremos el uso de los conjuntos de datos de Libgen utilizados para el entrenamiento", afirmó. En la práctica, esta medida implicaba que la empresa primero revisaría los archivos de Libgen para verificar si había obras robadas o pirateadas.

Los documentos judiciales revelan otras infracciones

En una de las charlas de trabajo, Kambadur también sugirió que el equipo de Meta AI debería ajustar los modelos para "evitar solicitudes de IP riesgosas", lo que configurará los modelos para que se nieguen a dar respuestas a los usuarios que intentan conocer los libros electrónicos en los que se entrenaron los modelos.

Los documentos presentados también revelaron otros detalles, como la posible utilización de Reddit para entrenar su modelo e imitar el comportamiento de una aplicación externa llamada Pushshift. Reddit mencionó en un comunicado de abril de 2023 que empezará a cobrar a las empresas de IA por el acceso a los datos para entrenar sus modelos.

Los demandantes en el presente caso han enmendado su demanda en numerosas ocasiones desde que comenzó la demanda en 2023. La presentación se realizó ante el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, en San Francisco. En la última enmienda, los demandantes alegaron que Meta comparó libros pirateados con libros protegidos por derechos de autor para determinar si sería conveniente cerrar un de licencia . Meta, por su parte, considera el caso como un asunto legal de gran importancia y ha decidido incorporar a dos litigantes de la Corte Suprema a su equipo de defensa.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO