Salesforce, el gigante del software, ha sido demandado por un grupo de autores en un tribunal federal de San Francisco por crear sus modelos de IA XGen con una biblioteca de libros pirateados. Según la demanda, eliminaron las referencias a dichas fuentes cuando surgieron dudas.
La demanda, presentada el miércoles por las autoras E. Molly Tanzer y Jennifer Gilmore al amparo de la Ley de Derechos de Autor, alega una infracción continua, afirmando que Salesforce "continúa haciéndolo al continuar almacenando, copiando, utilizando y procesando los conjuntos de datos que contienen copias de los libros protegidos por derechos de autor de los demandantes".
La denuncia cita declaraciones del de Salesforce, Marc Benioff, quien le dijo a un entrevistador de Bloomberg en enero de 2024 que las empresas de IA habían robado datos de entrenamiento y que todos los datos de entrenamiento habían sido robados.
Los autores buscan la certificación colectiva para todos los titulares de derechos de autor de Estados Unidos cuyas obras se hayan utilizado desde octubre de 2022. Buscan daños y perjuicios legales, la destrucción de las copias infractoras, la devolución de las ganancias, una declaración de infracción intencional y honorarios de abogados.
Salesforce se enfrenta a un casotron; las empresas de inteligencia artificial escaparon de demandas similares
Según la denuncia, Salesforce pirateó cientos de miles de libros con derechos de autor para desarrollar su serie XGen de grandes modelos lingüísticos. Para ello, utilizaron los conocidos conjuntos de datos RedPajama y The Pile, que contienen un corpus de libros llamado Books3 con más de 196.000 libros copiados del tracprivado Bibliotik.
La presentación indica que Salesforce mencionó por primera vez “RedPajama-Books” como una de sus fuentes de capacitación cuando lanzó XGen en junio de 2023. Un ingeniero de la empresa vinculó entonces a los usuarios de GitHub directamente con ambos conjuntos de datos.
Sin embargo, en septiembre, dichas menciones fueron retiradas del sitio web de Salesforce y reemplazadas por descripciones vagas de "datos en lenguaje natural" de "fuentes públicas". Al mes siguiente, Hugging Face, el sitio que alojaba Books3, eliminó el conjunto de datos por cuestiones de derechos de autor.
Además, la demanda reveló que, en 2022, Salesforce entrenó sus modelos CodeGen en The Pile. Posteriormente, la compañía introdujo la tecnología en el mercado a través de su plataforma de IA Agentforce, y el modelo XGen-Sales se lanzó en octubre de 2024.
Sin embargo, según los expertos, los autores deben demostrar un perjuicio económico real, no solo que sus libros se usaron para la capacitación. Recientemente, el juez Vince Chhabria desestimó demandas similares contra Meta, dictaminando que "simplemente afirmar que 'nuestro trabajo fue usado' no es suficiente". En ese sentido, el juez determinó que por parte de Meta de libros con derechos de autor para la capacitación de IA constituye un uso legítimo.
Además, según informa Cryptopolitan Cryptopolitan autores no demostraron el daño al mercado. Sin embargo, un juez criticó a Anthropic por mantener una biblioteca permanente de libros pirateados.
Salesforce aprovecha la inteligencia artificial Gemini de Google para impulsar Agentforce 360
En otras noticias, Salesforce ha ampliado su asociación con Google para incluir una integración más profunda de de IA de Gemini con su plataforma Agentforce 360.
La inteligencia multimodal de Gemini se integrará en el ecosistema de Salesforce como resultado de esta colaboración. Esto facilitará tareas como el razonamiento híbrido y la automatización de procesos multipaso en los servicios de ventas y TI empresariales.
La integración ampliada permite que el motor de razonamiento Atlas, fundamental para Agentforce 360, aproveche los modelos de Gemini. Esto ofrece a los flujos de trabajo empresariales opciones de modelo adicionales.
Además, la capacidad de razonamiento híbrido permite a los usuarios configurar agentes de IA dentro de Salesforce que generan resultados consistentes y precisos. La colaboración también amplía el alcance de la integración de Gemini con Salesforce, anteriormente limitada a Gmail, a otras aplicaciones de Google Workspace, como Hojas de Cálculo, Documentos, Drive, Presentaciones y Meet.
Agentforce 360 ahora es compatible con Google Workspace, lo que permite a los usuarios iniciar interacciones de ventas, calificar clientes potenciales y programar reuniones desde aplicaciones como Gmail y Google Calendar. También proporciona acceso directo a las aplicaciones de Salesforce Customer 360 dentro de las herramientas de Google, lo que optimiza el acceso a los datos y la continuidad del flujo de trabajo para los equipos de ventas y servicio.
Silvio Savarese, científico jefe de Salesforce, dijo : “En el entorno empresarial, es imperativo que los agentes de IA sean altamente capaces y consistentes, especialmente para casos de uso críticos […] Juntos, estamos estableciendo un nuevo estándar para construir el futuro de lo que es posible en Agentic Enterprise hasta el nivel de modelo”.

