법원 문서에 따르면 메타 직원들이 저작권이 있는 콘텐츠를 AI 학습에 사용하는 것에 대해 논의한 것으로 나타났습니다

오워

툰세 아데바요 지음

읽는 데 3분 소요 , 2025년 2월 22일

법원 문서에 따르면 메타 직원들이 저작권이 있는 콘텐츠를 AI 학습에 사용하는 것에 대해 논의한 것으로 나타났습니다

법원 문서에 따르면 메타의 직원들이 저작권이 있는 콘텐츠를 인공지능(AI) 모델 학습에 사용하는 것에 대해 논의한 것으로 나타났습니다.
내부 업무 채팅 내용을 통해 회사가 법적으로 문제가 될 수 있는 콘텐츠를 인공지능 모델 학습에 어떻게 활용했을 가능성이 있는지 드러났습니다.
법원 문서를 통해 다른 침해 사례들이 드러났고, 이에 원고들은 소송 내용을 수정했다.

법원 문서에 따르면 메타(Meta) 직원들이 저작권이 있는 콘텐츠를 인공지능 모델 학습에 사용하는 방안을 논의한 것으로 드러났습니다. 최근 법원 문서에 따르면 이러한 논의의 대부분은 법적으로 문제가 될 수 있는 경로로 입수한 콘텐츠와 관련된 것이었습니다.

이 문서는 미국 법원을 거친 수많은 AI 저작권 소송 중 하나인 카드리 대 메타 사건의 원고 측에서 공개했습니다. 메타 측은 저작권이 있는 저작물, 특히 서적을 자사 모델 학습에 사용하는 것은 공정 사용 정책에 해당한다고 주장했습니다. 그러나 사라 실버만과 타네히시 코츠가 이끄는 원고 측은 회사의 주장에 반박했습니다.

이전에 제출된 문서에 따르면, 메타의 CEO 마크 저커버그는 회사 AI 팀이 저작권이 있는 콘텐츠를 모델 학습에 사용하는 것을 승인했습니다. 또한 해당 문서는 메타가 도서 출판사들과의 데이터 라이선스 협상을 중단했다는 사실도 보여줍니다.

Meta는 저작권이 있는 콘텐츠를 사용하여 AI 모델을 학습시키는 것으로 알려져 있습니다

법원에 제출된 새로운 자료 에 따르면 , 메타 직원들이 주고받은 내부 업무 채팅 기록을 통해 회사가 저작권이 있는 데이터를 사용하여 라마(Llama) 제품군을 포함한 대부분의 AI 모델을 학습시킨 방식이 명확하게 드러났습니다

대화 중 하나에는 Meta의 고위 임원이자 라마 연구팀의 선임 매니저인 멜라니 캄바두르가 참여했습니다. 그녀는 대화에서 법적으로 정당하지 않은 콘텐츠로 AI 모델을 학습시킨 것에 대해 이야기했습니다.

"제 생각은 ('허락을 구하지 말고 용서를 구하라'는 말처럼) 장부를 확보해서 경영진에게 보고하고 그들이 결정을 내리도록 하는 것입니다."라고 메타 연구소 엔지니어인 자비에르 마르티네는 2023년 2월에 주고받은 채팅에서 말했다고 소송 서류에 나와 있습니다. 그는 "이것이 바로 그들이 인공지능 관련 조직을 만든 이유입니다. 위험 회피 성향을 줄이기 위해서죠."라고 덧붙였습니다.

마르티네는 회사가 여러 출판사와 라이선스 계약을 맺는 대신 소매가로 전자책을 구매하여 데이터 학습 세트를 구축할 수 있다고 언급했습니다. 다른 직원이 그러한 콘텐츠 사용과 법적 문제에 대해 경고하자, 마르티네는 다른 회사들도 아마 불법 복제 도서를 학습에 사용하고 있을 것이라고 말했습니다.

같은 대화에서 캄바두르는 회사가 몇몇 플랫폼과 라이선스 관련 협의를 진행 중이라고 언급했지만, 공개 데이터 사용에는 승인이 필요하며 회사 변호사들이 과거보다 덜 보수적인 태도를 보이고 있다고 덧붙였습니다. 캄바두르는 "지금 달라진 점은 자금도 더 많고, 변호사도 더 많고, 사업 개발 지원도 더 강화되었고, 신속하게 trac하거나 문제를 에스컬레이션할 수 있는 능력도 생겼다는 것입니다. 그래서 변호사들이 승인 절차에 대해 좀 더 관대해졌습니다."라고 말했습니다.

직원들이 Libgen 사용에 대해 논의합니다

소송 서류에 따르면, 또 다른 업무 관련 채팅 기록에서 캄바두르는 메타가 라이선스를 취득할 수 있는 데이터 소스로 저작권이 있는 콘텐츠 링크를 제공하는 웹사이트인 리브겐(Libgen)을 사용하는 것에 대해 논의한 것으로 나타났습니다. 리브겐은 저작권 침해 혐의로 여러 차례 소송을 당했으며, 서비스 중단 명령을 받은 바 있습니다.

채팅방에 있던 다른 동료가 사진을 올리고 "아니요, Libgen은 불법입니다."라고 덧붙인 반면, 최고 경영진 중 일부는 Libgen을 사용하지 않으면 AI 경쟁에서 회사의 경쟁력이 떨어질 수 있다고 생각하는 듯했습니다. Meta의 제품 관리 이사인 Sony Theakanath가 Meta AI 부사장인 Joelle Pineau에게 보낸 이메일에서 그는 Libgen이 모든 부문에서 최첨단(SOTA) 성능을 달성하는 데 중요하다고 언급했습니다.

테아카나스는 또한 회사가 법적 책임을 줄일 수 있는 몇 가지 방안에 대해 언급했는데, 여기에는 도난/불법 복제된 것으로 표시된 데이터를 삭제하고 다른 사용 사례를 공개적으로 언급하지 않는 것이 포함되었습니다. 그는 "학습에 사용된 Libgen 데이터셋의 사용처는 공개하지 않을 것"이라고 말했습니다. 실제로 이는 회사가 Libgen 파일을 먼저 검토하여 "도난 또는 불법 복제된" 저작물이 있는지 확인하는 것을 의미했습니다.

법원 문서를 통해 다른 침해 사례들이 드러났습니다

업무 관련 채팅 중 하나에서 캄바두르는 메타 AI 팀이 "위험한 IP 프롬프트를 피하도록" 모델을 조정해야 한다고 제안했는데, 이는 모델이 학습에 사용된 전자책을 알고 싶어하는 사용자에게 답변을 제공하지 않도록 모델을 설정하는 것을 의미합니다.

이번 서류 제출을 통해 다른 세부 사항들도 드러났는데, 그중 하나는 Meta가 Reddit 데이터를 사용하여 Pushshift라는 타사 애플리케이션의 동작을 모방하는 모델을 학습시켰을 가능성이 있다는 점입니다 . Reddit은 2023년 4월 성명에서 AI 기업들이 모델 학습을 위해 데이터에 접근하는 데 비용을 청구하기 시작할 것이라고 밝혔습니다.

이번 소송의 원고들은 2023년 소송 제기 이후 여러 차례 소장을 수정했습니다. 소송은 샌프란시스코 소재 미국 캘리포니아 북부 지방법원에 제기되었습니다. 최근 수정된 소장에서 원고들은 메타(Meta)가 저작권이 있는 책과 불법 복제된 책을 대조하여 라이선스 계약 체결 여부를 결정했다고 주장했습니다. 메타 측은 이 사건을 중대한 법적 쟁점으로 보고 있으며, 변호인단에 대법원급 소송 전문가 두 명을 추가했습니다.

이 글을 읽고 계시다면 이미 앞서 나가고 계신 겁니다. 뉴스레터를 구독하시면 더욱 유익한 정보를 받아보실 수 있습니다.

리브겐 메타 푸시시프트 레딧 USD

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

오워툰세 아데바요

아데바요는 암호화폐 분야에서 4년 경력을 가진 작가입니다. 그는 라고스 대학교에서 도시 및 지역 계획을 전공했습니다. 토큰헬(Tokenhell)과 크립토티커(CryptoTicker)에서 암호화폐 및 핀테크 관련 뉴스를 작성했으며, 현재는 Cryptopolitan의 뉴스 기고자로 활동하고 있습니다.