소프트웨어 대기업 세일즈포스가 불법 복제 도서를 기반으로 XGen AI 모델을 구축했다는 이유로 샌프란시스코 연방 법원에 작가 그룹으로부터 소송을 당했습니다. 소송에 따르면, 세일즈포스는 문제가 제기되자 해당 출처에 대한 언급을 모두 삭제했습니다.
수요일, 작가 E. 몰리 탄저와 제니퍼 길모어는 저작권법에 따라 소송을 제기했습니다. 소장에는 세일즈 포스가 "원고들의 저작물을 담은 데이터 세트를 계속 저장, 복사, 사용 및 처리함으로써 저작권을 지속적으로 침해하고 있다"고 명시되어 있습니다.
소장에는 세일즈포스 CEO 마크 베니오프가 2024년 1월 블룸버그와의 인터뷰에서 AI 기업들이 학습 데이터를 도용했으며 모든 학습 데이터가 도난당했다고 말한 내용이 인용되어 있습니다.
저작자들은 2022년 10월 이후 저작물이 무단 사용된 모든 미국 저작권자들을 대표하여 집단 소송 자격을 인정받고자 합니다. 이들은 법정 손해 배상, 무단 복제물 파기, 수익 반환, 고의적 침해 인정 및 변호사 비용을 청구하고 있습니다.
세일즈포스는tron소송에 직면해 있지만, AI 기업들은 유사한 소송을 피했습니다
소장에 따르면, 세일즈포스는 대규모 언어 모델 시리즈인 XGen을 개발하기 위해 수십만 권의 저작권이 있는 도서를 불법 복제했습니다. 이들은 악명 높은 "RedPajama"와 "The Pile" 데이터셋을 이용했는데, 이 데이터셋에는 개인 trac업체인 Bibliotik에서 복제한 19만 6천 권 이상의 도서가 포함된 Books3라는 도서 코퍼스가 있습니다.
해당 서류에 따르면 세일즈포스는 2023년 6월 XGen을 출시했을 당시 "RedPajama-Books"를 학습 소스 중 하나로 처음 언급했습니다. 이후 회사 엔지니어가 GitHub 사용자들을 두 데이터 세트에 직접 연결했습니다.
하지만 9월이 되자 세일즈포스 웹사이트에서 해당 언급이 삭제되고 "공개적으로 이용 가능한 소스"에서 가져온 "자연어 데이터"라는 모호한 설명으로 대체되었습니다. 그 다음 달에는 Books3를 호스팅했던 Hugging Face 사이트가 저작권 문제로 해당 데이터 세트를 삭제했습니다.
또한, 소송을 통해 세일즈포스가 2022년에 CodeGen 모델을 The Pile 데이터셋으로 학습시켰다는 사실이 밝혀졌습니다. 이후 세일즈포스는 Agentforce AI 플랫폼을 통해 해당 기술을 시장에 출시했으며, XGen-Sales 모델은 2024년 10월에 공개되었습니다.
하지만 전문가들에 따르면, 저작자는 단순히 책이 학습에 사용되었다는 사실만으로는 부족하고, 실질적인 금전적 손해를 입증해야 합니다. 최근 빈스 차브리아 판사는 메타를 상대로 제기된 유사한 소송을 기각하면서 "단순히 '우리의 저작물이 사용되었다'고 주장하는 것만으로는 충분하지 않다"고 판결했습니다. 이에 따라 판사는 메타가 저작권이 있는 책을 AI 학습에 사용한 것을 공정 사용으로 인정했습니다.
또한, Cryptopolitan 의 보도 , 최근 판결에서는 유사한 사례에서 오픈AI와 앤스로픽(Anthropic) 측에 유리한 결과가 나왔으며, 판사들은 저작권자들이 시장 피해를 입증하지 못했다고 판단했습니다. 하지만 한 판사는 앤스로픽이 불법 복제 도서를 영구적으로 보관하는 것에 대해 비판했습니다.
세일즈포스는 에이전트포스 360에 구글의 제미니 AI를 도입했습니다
다른 소식으로는, 세일즈포스가 구글과의 파트너십을 확장하여 제미니 AI 모델을 에이전트포스 360 플랫폼에 더욱 심층적으로 통합하기로 했습니다.
이번 파트너십을 통해 제미니의 멀티모달 인텔리전스가 세일즈포스 생태계에 통합될 예정입니다. 이는 기업 영업 및 IT 서비스 전반에 걸쳐 하이브리드 추론 및 다단계 프로세스 자동화와 같은 작업을 지원하는 데 도움이 될 것입니다.
확장된 통합 기능을 통해 Agentforce 360의 핵심인 Atlas 추론 엔진이 Gemini 모델을 활용할 수 있게 되었습니다. 이를 통해 기업 워크플로우에 더 많은 모델 옵션이 제공됩니다.
또한, 하이브리드 추론 기능을 통해 사용자는 Salesforce 내에서 일관되고 정확한 결과를 생성하는 AI 에이전트를 설정할 수 있습니다. 이번 협력을 통해 기존에 Gmail에만 적용되었던 Salesforce의 Gemini 통합 기능이 Sheets, Docs, Drive, Slides, Meet 등 다른 Google Workspace 애플리케이션으로 확장되었습니다.
Agentforce 360은 이제 Google Workspace와의 기본 상호 운용성을 지원하여 사용자가 Gmail 및 Google Calendar와 같은 애플리케이션 내에서 영업 활동을 시작하고, 잠재 고객을 검증하고, 회의 일정을 예약할 수 있도록 합니다. 또한 Google 도구 내에서 Salesforce Customer 360 앱에 직접 액세스할 수 있어 영업 및 서비스 팀의 데이터 액세스 및 워크플로 연속성을 간소화합니다.
세일즈포스의 최고 과학자 실비오 사바레세 는 " 엔터프라이즈 환경에서는 특히 중요한 사용 사례의 경우 AI 에이전트가 매우 뛰어난 역량과 일관성을 갖추는 것이 필수적입니다. [...] 우리는 함께 모델 수준에 이르기까지 에이전트 기반 엔터프라이즈에서 가능한 미래의 모습을 구축하기 위한 새로운 표준을 만들어가고 있습니다."라고 말했습니다.

