Meta Platforms entrenó sus modelos de IA utilizando versiones pirateadas de libros con derechos de autor, con la aprobación de su CEO, Mark Zuckerberg.
Según documentos judiciales recientemente revelados, un grupo de autores alega que el gigante de las redes sociales sabía que estaban utilizando trabajos pirateados para entrenar sus sistemas de inteligencia artificial.
Documentos internos de Meta “revelan” las afirmaciones
En su presentación ante el tribunal, los autores afirmaron que los documentos internos presentados por Meta durante el proceso de descubrimiento de pruebas demostraban que la red social tenía conocimiento de los libros pirateados. Según The Guardian , su director ejecutivo, Zuckerberg, respaldó el uso del conjunto de datos LibGen, un enorme archivo de libros en línea. Esto ocurrió a pesar de las advertencias del equipo ejecutivo de inteligencia artificial de la compañía, que afirmaba que se trata de un conjunto de datos que "sabemos que es pirateado".
El autor estadounidense Ta-Nehisi Coates, la comediante Sarah Silverman y otros escritores que demandaron a la compañía por violación de derechos de autor hicieron las acusaciones en documentos que se hicieron públicos el miércoles en un tribunal federal de California.
Los autores llevaron a Meta a los tribunales en 2023 por acusaciones de que la empresa de redes sociales estaba haciendo un mal uso de sus libros para entrenar modelos de inteligencia artificial, específicamente Llama, su gran modelo de lenguaje que impulsa sus chatbots.
El conjunto de datos Library Genesis o LibGen, originario de Rusia, es una “biblioteca fantasma” que afirma contener millones de novelas, libros de notificaciones y artículos de revistas científicas.
En 2024, un tribunal federal de Nueva York solicitó a los operadores anónimos de LibGen que pagaran a un grupo de editores 30 millones de dólares en daños y perjuicios por infracción de derechos de autor.
Esta es una de las muchas denuncias que alegan que obras protegidas por derechos de autor de autores, artistas y otros se utilizaron para entrenar herramientas de IA generativa como el chatbot ChatGPT sin el consentimiento de sus propietarios. Los profesionales creativos han advertido que usar su obra sin su consentimiento pone en peligro sus modelos de negocio.
según Reuters , los acusados argumentaron que hicieron un uso justo de material protegido por derechos de autor.
El juez permitió a los autores presentar una denuncia enmendada
En el caso Meta, los autores solicitaron al tribunal el miércoles autorización para presentar una demanda actualizada. En sus argumentos, indicaron que nuevas pruebas demostraban que las empresas de redes sociales utilizaron el conjunto de datos de entrenamiento de IA LibGen, que incluye millones de obras pirateadas, y lo distribuyeron mediante torrents peer-to-peer.
Según ellos, Zuckerberg “aprobó el uso del conjunto de datos LibGen por parte de Meta a pesar de las preocupaciones dentro del equipo ejecutivo de IA de Meta (y otros en Meta) de que LibGen es 'un conjunto de datos que sabemos que está pirateado'”
La presentación también cita un memorando que hace referencia a las iniciales de Zuckerberg, señalando que "después de la escalada a MZ", el equipo de inteligencia artificial de Meta "ha sido aprobado para utilizar LibGen"
El año pasado, el juez de distrito estadounidense Vince Chhabria desestimó las acusaciones de que el texto generado por los modelos de IA de Meta infringía los derechos de autor de los autores y de que Meta había eliminado ilegalmente la información sobre la gestión de derechos de autor de los libros. Esto se refiere a información sobre la obra, como el título, el nombre del autor y el titular de los derechos de autor.
Sin embargo, se permitió a los demandantes modificar sus demandas. En sus argumentos de esta semana, los autores afirmaron que las pruebas respaldaban sus demandas por infracción y justificaban la reactivación de su caso de información sobre gestión de derechos de autor, añadiendo una nueva acusación de fraude informático.
Durante una audiencia el jueves, el juez dijo que permitiría a los autores presentar una denuncia enmendada aunque era escéptico sobre los méritos de las acusaciones de fraude.

