ÚLTIMAS NOTICIAS

vivir Bitcoin se dispara repentinamente por encima de los 82.000 dólares

Hace 2 horas Actualizaciones en vivo
El presidente de la Bolsa de Corea impulsa los derivados de criptomonedas en Busan mientras los gigantes de TradFi se mueven en el mercado de perpetuidades de 86 billones de dólares

Hace 3 minutos Noticias
El fundador de LayerZero responde a las afirmaciones "completamente falsas" sobre el hackeo de KelpDAO

Hace 17 minutos Noticias
Iggy Azalea se enfrenta a una demanda colectiva por el colapso de los tokens de MOTHER

de hace 2 horas Noticias

SELECCIONADO PARA TI

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Tecnología

El personal de Meta discutió el uso de contenido con derechos de autor para el entrenamiento de IA, según muestran documentos judiciales

Por

Owotunse Adebayo

3 minutos de lectura 22 de febrero de 2025

El personal de Meta discutió el uso de contenido con derechos de autor para el entrenamiento de IA, según muestran documentos judiciales

Documentos judiciales han demostrado que el personal de Meta discutió el uso de contenido protegido por derechos de autor para entrenar sus modelos de inteligencia artificial (IA).
Las charlas internas de trabajo también mostraron cómo la empresa puede haber utilizado contenido legalmente problemático para entrenar sus modelos de IA.
Los documentos judiciales han revelado otras infracciones y los demandantes han modificado su demanda.

Documentos judiciales demuestran que el personal de Meta ha discutido el uso de contenido protegido por derechos de autor para entrenar sus modelos de inteligencia artificial. Según documentos judiciales recientes, la mayoría de las conversaciones se relacionaron con contenido obtenido por medios legalmente cuestionables.

Los documentos fueron puestos a disposición por los demandantes en el caso Kadrey contra Meta, uno de los numerosos casos de derechos de autor de IA que se han tramitado en los tribunales estadounidenses. Según las alegaciones de Meta, el uso de obras protegidas por derechos de autor, especialmente libros, para entrenar a sus modelos se rige por la política de uso legítimo. Sin embargo, los demandantes, encabezados por Sarah Silverman y Ta–Nehisi Coates, han discrepado de las alegaciones de la empresa.

Según documentos presentados previamente, el director ejecutivo de Meta, Mark Zuckerberg, autorizó al equipo de IA de la compañía a usar contenido protegido por derechos de autor para entrenar sus modelos. Los documentos también muestran que la compañía también interrumpió sus negociaciones de licencias de datos con editoriales.

Meta supuestamente utiliza contenido protegido por derechos de autor para entrenar sus modelos de IA

Según nuevos documentos presentados ante el tribunal, los chats de trabajo internos compartidos entre trabajadores de Meta han mostrado una imagen clara de cómo la empresa puede haber utilizado datos con derechos de autor para entrenar sus modelos de IA, incluidos la mayoría de los modelos de la familia Llama.

Una de las charlas contó con la participación de Melanie Kambadur, alta ejecutiva de Meta y gerente sénior del equipo de investigación de Llama. En su charla, Kambadur habló sobre el entrenamiento de los modelos de IA con contenido sin justificación legal.

“Mi opinión sería (en la línea de 'pedir perdón, no permiso'): intentamos adquirir los libros y escalar el asunto a los ejecutivos para que tomen la decisión”, dijo el ingeniero de investigación de Meta, Xavier Martinet, en una charla fechada en febrero de 2023, según los documentos. “Por eso crearon esta organización de inteligencia artificial general: para que podamos ser menos reacios al riesgo”, añadió.

Martinet mencionó que la empresa podría simplemente comprar libros electrónicos a precio de minorista para crear el conjunto de datos de capacitación, en lugar de firmar acuerdos de licencia con diferentes editoriales. Mientras otro empleado advirtió sobre el uso de dicho contenido y las consecuencias legales, Martinet mencionó que otras empresas probablemente también estaban utilizando libros pirateados para la capacitación.

En la misma charla, Kambadur mencionó que la empresa estaba en conversaciones con algunas plataformas para obtener licencias, pero señaló que, si bien el uso de datos públicos requiere aprobaciones, los abogados de la empresa eran menos conservadores que antes. "La diferencia ahora es que tenemos más dinero, más abogados, más ayuda de desarrollo empresarial, capacidad de acelerar tracy escalar para mayor rapidez, y los abogados están siendo un poco menos conservadores con las aprobaciones", dijo Kambadur.

Los empleados hablan sobre el uso de Libgen

Según el expediente, en otro chat de trabajo, Kambadur habló sobre el uso de Libgen, un sitio web agregador que proporciona enlaces a contenido protegido por derechos de autor de editoriales, como fuente de datos que Meta puede licenciar. Libgen ha sido demandada en numerosas ocasiones, y se le ha ordenado a la plataforma cerrar sus servicios debido a denuncias de infracción de derechos de autor.

Mientras otro colega en el chat publicó una foto y añadió: "No, Libgen no es legal", parecía que algunos altos ejecutivos creían que no usar Libgen podría perjudicar la competitividad de la empresa en la carrera de la IA. En un correo electrónico enviado por el director de gestión de productos de Meta, Sony Theakanath, a Joelle Pineau, vicepresidenta de IA de Meta, este señaló que Libgen era importante para alcanzar las cifras más avanzadas (SOTA) en todas las categorías.

Theakanath también habló sobre varias maneras en que la empresa podría reducir la exposición legal, incluyendo la eliminación de datos marcados como robados o pirateados y la omisión de citar públicamente otros usos. "No divulgaremos el uso de los conjuntos de datos de Libgen utilizados para el entrenamiento", afirmó. En la práctica, esta medida implicaba que la empresa primero revisaría los archivos de Libgen para verificar si había obras robadas o pirateadas.

Los documentos judiciales revelan otras infracciones

En una de las charlas de trabajo, Kambadur también sugirió que el equipo de Meta AI debería ajustar los modelos para "evitar solicitudes de IP riesgosas", lo que configurará los modelos para que se nieguen a dar respuestas a los usuarios que intentan conocer los libros electrónicos en los que se entrenaron los modelos.

Los documentos presentados también revelaron otros detalles, como la posible utilización de Reddit para entrenar su modelo e imitar el comportamiento de una aplicación externa llamada Pushshift. Reddit mencionó en un comunicado de abril de 2023 que empezará a cobrar a las empresas de IA por el acceso a los datos para entrenar sus modelos.

Los demandantes en el presente caso han enmendado su demanda en numerosas ocasiones desde que comenzó la demanda en 2023. La presentación se realizó ante el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, en San Francisco. En la última enmienda, los demandantes alegaron que Meta comparó libros pirateados con libros protegidos por derechos de autor para determinar si sería conveniente cerrar un de licencia . Meta, por su parte, considera el caso como un asunto legal de gran importancia y ha decidido incorporar a dos litigantes de la Corte Suprema a su equipo de defensa.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Libgen Meta Pushshift Reddit USD

Comparte este artículo

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

Owotunse Adebayo

Adebayo es un escritor con cuatro años de experiencia en el sector de las criptomonedas. Se graduó de la Universidad de Lagos, donde estudió Planificación Urbana y Regional. Ha trabajado en Tokenhell y CryptoTicker, escribiendo noticias sobre criptomonedas y tecnología financiera. Actualmente colabora en Cryptopolitan.

ÍNDICE

1. Meta supuestamente utiliza contenido protegido por derechos de autor para entrenar sus modelos de IA

2. Los empleados hablan sobre el uso de Libgen

3. Los documentos judiciales revelan otras infracciones

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

INTENSIVO CRIPTOMONEDAS
CURSO

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)