ニューヨーク・タイムズは、 AIコミュニティに衝撃を与えた最近の法的展開として、 OpenAI
この訴訟は、同社の大規模言語モデル(LLM)、特にGPT-4および関連製品が、大量の著作権侵害に基づくビジネスモデルであると主張している。この訴訟は、生成AIモデルの学習データの調達をめぐる倫理的な懸念を浮き彫りにした。
著作権侵害の申し立て
訴訟の核心は、OpenAIとMicrosoftが、著作権で保護されたテキストやその他のコンテンツ(ニューヨーク・タイムズの記事を含む)を、適切な許可なくLLMの学習に使用したという主張です。訴訟では、これらのLLMがニューヨーク・タイムズをはじめとする様々な情報源から、逐語的に繰り返しコンテンツを複製していると主張しています。
この訴訟は、AIコミュニティ内外において、法学修士課程(LLM)の学習データの倫理的調達に関する懸念が高まっていることを浮き彫りにしています。学習データの出所、盗まれた知的財産が含まれているかどうか、そしてこれがオリジナルコンテンツに依存するクリエイターや業界にどのような影響を与えるのかといった疑問が提起されています。
ジャーナリズムとコンテンツ制作への影響
この訴訟は、AIによる著作権侵害がコンテンツ制作者とジャーナリズムに及ぼす壊滅的な影響を強調しています。GoogleやBingなどのAIプラットフォームがコンテンツプロバイダーから無断で盗用されたアイデアや表現を取り入れると、プロバイダーがコンテンツを収益化する能力が損なわれると主張しています。これはひいては、報道機関の財務的な存続と、質の高いジャーナリズムへの資金提供能力を脅かすことになります。
訴状では、「タイムズの知的財産の保護は、公共の利益のために世界クラスのジャーナリズムに資金を提供し続ける上で極めて重要です。タイムズや同業他社がコンテンツの利用をコントロールできなければ、そのコンテンツを収益化する能力が損なわれるでしょう」と述べられています。
収入が減れば、報道機関は重要で深掘りされたニュースに時間とリソースを割けるジャーナリストが少なくなり、そうしたニュースが報道されないリスクが生じます。ジャーナリズムの創出は減少し、社会への損失は甚大なものとなるでしょう。
著作権で保護されたコンテンツに対するAIモデルの反応
この訴訟では、法学修士(LLM)が指示に対して一貫性のない応答をすることが多く、場合によっては著作権で保護されたテキストを逐語的に生成する一方で、場合によっては内容を言い換えることもあることが強調されています。しかし、これは根本的な疑問を提起します。それは、著作権で保護された資料をAIソフトウェアの学習に使用することは著作権侵害行為に当たるのか、ということです。
ニューヨーク・タイムズ紙は、 LLMを自体が著作権侵害に当たると主張している。この見解は、サラ・シルバーマン、クリストファー・ゴールデン、リチャード・カドリーの3人の作家による集団訴訟でも支持されており、LLMは著作tracれた表現情報なしでは機能しないため、二次著作物の著作権を侵害していると主張している。
AI倫理に関する進行中の議論
ニューヨーク・タイムズが起こした法的措置は、AIをめぐる倫理的配慮と、テクノロジー企業が自社のAIモデルが倫理的に得られたデータに基づいて構築されることを保証する責任について、より広範な議論を引き起こした。
AI が進歩し、さまざまな業界でますます重要な役割を果たすようになるにつれて、データの使用、知的財産権、コンテンツ生成倫理に関する疑問がより緊急なものになっています。

