소셜 미디어 플랫폼 레딧은 인공지능 스타트업 퍼플렉시티가 자사의 데이터를 불법적으로 수집하여 AI 기반 검색 엔진을 학습시켰다며 소송을 제기했습니다. 레딧은 퍼플렉시티가 도난당한 데이터를 기반으로 200억 달러 규모의 기업을 키웠다고 비난했습니다.
보도에 따르면, 레딧은 수요일 뉴욕 연방 법원에 다른 세 회사를 상대로 소송을 제기했는데, 레딧은 이 데이터 스크래핑 업체들이 자사의 데이터 보호 조치를 우회하여 "퍼플렉시티(Perplexity)가 답변 엔진 학습에 절실히 필요로 하는 데이터를 훔쳤다"고 주장했습니다. 이번 소송은 저작권이 있는 자료를 무단으로 사용하여 AI 시스템을 학습시킨 혐의로 콘텐츠 제작자들이 기술 기업들을 상대로 제기한 수많은 소송 중 하나입니다.
특히 뉴스 발행사들은 AI 기업들이 허가 없이 자신들의 콘텐츠를 사용하는 행위가 독자층과 광고 수익을 빼앗아 가고 있으며, 이로 인해 이미 취약한 사업 모델이 위협받고 있다고 주장합니다.
Perplexity는 Reddit의 "위협"에 맞서 스스로를 방어하고 있습니다
레딧의 주장에 대해 퍼플렉시티는 자사의 방법론을 옹호했습니다.
"저희는 정확한 AI를 통해 사실에 기반한 답변을 제공하는 원칙적이고 책임감 있는 접근 방식을 고수할 것이며, 개방성과 공익에 대한 위협을 용납하지 않을 것입니다."라고 해당 스타트업은 성명에서 밝혔습니다.
올해 6월, 수천 개의 관심사 기반 "서브레딧" 커뮤니티로 구성된 레딧은
"AI 기업들은 양질의 인간 콘텐츠를 확보하기 위한 군비 경쟁에 몰두하고 있으며, 이러한 압력은 산업 규모의 '데이터 세탁' 경제를 부추겼습니다."
레딧 최고 법률 책임자 벤 리.
레딧은 자사가 AI가 생성한 답변의 가장 많이 인용되는 출처라고 주장합니다. 또한 구글, 오픈AI와 같은 주요 기술 기업들과 AI 시스템 학습을 위한 라이선스 계약을
최근 제기된 소송에서 레딧은 현재 레딧과 콘텐츠 사용 라이선스 계약을 맺지 않은 퍼플렉시티가 리투아니아에 본사를 둔 옥실랩스, 러시아에 본사를 둔 AWMProxy, 그리고 텍사스에 본사를 둔 세르파피 등 최소 3곳의 데이터 스크래핑 업체와 협력했다고 주장했습니다. 레딧은 이들 업체가 수십억 건의 검색 결과에서 자사 데이터를 불법적으로 수집했다고 비난하고 있습니다.
법원 서류에 따르면, 레딧은 작년에 퍼플렉시티에게 저작권 침해 중지 요청 서한을 보냈습니다. 그러나 퍼플렉시티는 해당 서한을 받은 후에도 레딧 인용 횟수를 40배나 늘린 것으로 알려졌습니다.
나머지 세 회사의 대변인은 이 문제에 대해 즉각적인 논평을 내놓지 않았습니다. 레딧은 또한 구체적인 액수는 밝히지 않은 금전적 손해배상과 퍼플렉시티의 데이터 사용 금지 명령을 요구하고 있는 것으로 알려졌습니다.
퍼플렉시티에게 이는 새로운 일이 아닙니다. 저작권 침해를 이유로 AI 스타트업을 상대로 제기된 일련의 소송에 추가된 사건이기 때문입니다.
지난 8월, 일본의 주요 언론사인 닛케이와 아사히 신문은 저작권 침해를 이유로 AI 검색 엔진 업체 퍼플렉시티를 도쿄 지방법원에 공동으로 고소했습니다. Cryptopolitan , 두 언론사는 퍼플렉시티가 자사 기사에 잘못된 정보를 제공하여 신뢰도를 훼손할 수 있다고 주장했습니다.
닛케이와 아사히 신문은 각각 22억 엔(미화 1470만 달러)의 손해배상을 요구했으며, 퍼플렉시티 측에 저장된 기사들을 삭제해 줄 것을 요청했다.
하지만 이게 다가 아닙니다. 앞서 뉴욕 포스트와 루퍼트 머독의 다우 존스도 퍼플렉시티가 자사 플랫폼의 챗봇을 통해 뉴스 매체의 콘텐츠를 이용해 질문에 답변함으로써 고객과 수익을 빼앗아 가고 있다고 주장했습니다.
BBC 또한 퍼플렉시티에 콘텐츠 무단 사용을 중단하라는 내용의 경고장을 보내며, 다른 언론사들과 함께 해당 목록에 이름을 올렸습니다 . 뉴욕 타임스와 콘데 나스트 등 다른 언론사들도 AI 기업인 퍼플렉시티에 허가 없이 콘텐츠를 사용하지 말 것을 요구하는 유사한 내용의 경고장을 전달했습니다.

