裁判資料によると、メタのスタッフは著作権で保護されたコンテンツをAIのトレーニングに使用することを検討していた。

著

読了時間3分 2025年2月22日

裁判資料によると、メタのスタッフは著作権で保護されたコンテンツをAIのトレーニングに使用することを検討していた。

裁判所の文書によると、Metaのスタッフが著作権で保護されたコンテンツを使用して人工知能（AI）モデルをトレーニングすることについて話し合っていたことが明らかになった。.
社内のチャットでは、同社が法的に問題のあるコンテンツを使用して AI モデルをトレーニングしていた可能性も明らかになった。.
裁判所の文書では他の侵害も明らかにされており、原告は訴訟を修正している。.

裁判所の文書によると、Metaのスタッフが著作権で保護されたコンテンツを使用して人工知能モデルを訓練することについて協議していたことが明らかになった。最近の裁判所文書によると、協議のほとんどは法的に問題のある手段で取得されたコンテンツに関連していた。.

これらの文書は、米国の裁判所で審理された数多くのAI著作権訴訟の一つであるKadrey対Meta訴訟の原告によって公開された。Metaの主張によれば、同社のモデルの学習に著作物、特に書籍を使用することはフェアユースポリシーに違反しない。しかし、サラ・シルバーマン氏とタ・ネヒシ・コーツ氏を中心とする原告は、同社の主張に異議を唱えている。.

以前に提出された文書によると、MetaのCEOであるマーク・ザッカーバーグ氏は、同社のAIチームが著作権で保護されたコンテンツを使用してモデルのトレーニングを行うことを承認した。さらに、文書には同社が書籍出版社とのデータライセンス交渉を打ち切ったことも記載されていた。.

Metaは著作権のあるコンテンツをAIモデルのトレーニングに使用しているとされている

新たな書類、Metaの従業員間で共有された社内チャットには、同社がLlamaファミリーのモデルのほとんどを含むAIモデルのトレーニングに著作権で保護されたデータをどのように使用していたかが明確に示されている。

チャットの一つには、Metaのシニアエグゼクティブで、Llama研究チームのシニアマネージャーを務めるMelanie Kambadur氏が参加していました。彼女はチャットの中で、法的に正当化されていないコンテンツでAIモデルをトレーニングすることについて話しました。.

「私の意見は（『許可を求めるのではなく、許しを求める』という点において）、我々は本を入手し、幹部にエスカレーションして決定を下すように努めている」と、Metaの研究エンジニアであるザビエル・マルティネット氏は2023年2月のチャットで述べたと提出書類には記されている。「彼らがこのgen ai組織を設立したのは、まさにそのためだ。我々がリスク回避的になるのを防ぐためだ」と彼は付け加えた。.

マルティネット氏は、データトレーニングセットを構築するために、複数の出版社とライセンス契約を結ぶ代わりに、電子書籍を小売価格で購入するだけで済むと述べた。別の従業員がそのようなコンテンツの使用と法的影響について警告した一方で、マルティネット氏は、他の企業もトレーニングに海賊版書籍を使用している可能性が高いと述べた。.

同じチャットで、カンバドゥール氏は、同社がライセンス取得のためにいくつかのプラットフォームと交渉中であると述べたものの、公開データの使用には承認が必要だが、同社の弁護士は以前ほど慎重ではないと指摘した。「今は資金も弁護士も増え、ビジネス開発部門の支援も充実し、迅速な対応のためにファスト trac／エスカレーションを行う能力があり、弁護士も承認に関して以前ほど慎重ではないという点が違います」とカンバドゥール氏は述べた。.

従業員がLibgenの使用について話し合う

提出書類によると、別の職場チャットでは、カンバドゥール氏が、Metaがライセンスを取得できるデータソースとして、出版社の著作権コンテンツへのリンクを提供するアグリゲーターウェブサイト「Libgen」の利用について話していたことが確認されている。Libgenは著作権侵害の申し立てにより、何度も訴訟を起こされており、プラットフォームはサービスを停止するよう命じられている。.

チャットに参加していた別の同僚が写真を投稿し、「いいえ、Libgenは違法です」と付け加えた一方で、経営幹部の中には、Libgenを使用しないことでAI競争における同社の競争力が損なわれる可能性があると考えている者もいるようでした。Metaの製品管理ディレクターであるソニー・テアカナス氏がMeta AIのバイスプレジデントであるジョエル・ピノー氏に送ったメールの中で、同氏はLibgenがあらゆるカテゴリーで最先端技術（SOTA）の数値を達成する上で重要であると述べています。.

テアカナート氏は、盗難・海賊版とマークされたデータを削除することや、他の利用方法を公に引用しないことなど、法的リスクを軽減するための複数の方法についても言及した。「学習に使用したLibgenデータセットの使用状況は開示しません」と同氏は述べた。実際には、この措置は、同社がまずLibgenファイルを調べて「盗難・海賊版」の作品がないか確認することを意味している。.

裁判所の文書は他の違反行為を明らかにしている

仕事上のチャットの1つで、カンバドゥール氏はまた、Meta AIチームがモデルを調整して「危険なIPプロンプトを回避する」べきだと提案した。これは、モデルがトレーニングされた電子書籍を知ろうとするユーザーに対して、回答を拒否するようにモデルを構成することになる。.

提出書類にはその他の詳細も記載されており、Metaが Redditのデータを使用して、Pushshiftと呼ばれるサードパーティ製アプリケーションの動作を模倣するモデルをトレーニングしていた可能性があることが明らかになった。Redditは2023年4月の声明で、AI企業に対し、モデルトレーニング用のデータへのアクセスに対して料金を請求すると発表した。

本件の原告は、2023年の訴訟開始以来、訴状を何度も修正してきました。提出は、サンフランシスコの米国カリフォルニア州北部地区連邦地方裁判所で行われました。最新の修正において、原告はMetaが著作権のある書籍と海賊版書籍を相互参照し、ライセンス契約の締結が適切かどうかを判断する際に、そのように行動したと主張しました。Metaは、本件を極めて重要な法的問題と捉え、最高裁判所の訴訟弁護士2名を弁護団に加える予定です。

この記事を読んでいるあなたは、既に一歩先を行っています。ニュースレターを購読して、その優位性を維持しましょう。

Libgen Meta Pushshift Reddit USD

この記事を共有する

免責事項： 本情報は投資助言ではありません。Cryptopolitan.com Cryptopolitan、本ページの情報に基づいて行われた投資について一切責任を負いません。投資判断を行う前に、ごtrondentdentdentdentdentdentdentdent で調査を行うか、資格のある専門家にご相談されることを

オウォトゥンセ・アデバヨ

アデバヨ氏は、仮想通貨分野で4年間の経験を持つライターです。ラゴス大学で都市・地域計画を学び、卒業しました。TokenhellとCryptoTickerで勤務し、仮想通貨とフィンテックに関するニュースを執筆しています。現在は Cryptopolitanのニュース寄稿者です。.

1. Metaは著作権のあるコンテンツをAIモデルのトレーニングに使用しているとされている

2. 従業員がLibgenの使用について話し合う

3. 裁判所の文書は他の違反行為を明らかにしている

この記事を共有する