2025年12月02日 15時00分
AI


OpenAIは、海賊版書籍で構成された2つのデータセット「Books1」と「Books2」を削除した理由について、苦しい説明を迫られています。このデータセットの削除理由は、ChatGPTが作家たちの著作権を侵害して学習されたとする集団訴訟において、勝敗を分ける決定的な要因になる可能性があります。

Memorandum & Opinion – #782 in Authors Guild v. OpenAI Inc. (S.D.N.Y., 1:23-cv-08292) – CourtListener.com
https://www.courtlistener.com/docket/67810584/782/authors-guild-v-openai-inc/

OpenAI desperate to avoid explaining why it deleted pirated book datasets – Ars Technica
https://arstechnica.com/tech-policy/2025/12/openai-desperate-to-avoid-explaining-why-it-deleted-pirated-book-datasets/

この訴訟は2023年に3人のアメリカ人作家が「OpenAIのChatGPTは、著作権で保護された自分たちの書籍を学習素材として無断使用した」と訴えたものです。

OpenAIとMetaが著作権侵害で3人の作家から訴えられる – GIGAZINE


この問題の発端は、OpenAIの説明が二転三転したことにあります。2024年3月、OpenAIの外部弁護士は原告に対し、「LibGen(Library Genesis)」が「不使用」を理由に2022年に削除されたと説明していました。しかしその後、OpenAIはこの「不使用」という理由は弁護士とのやり取りに含まれる機密事項であると主張し、詳細な開示を拒否。さらに2025年6月には、過去の主張を撤回し、削除のすべての理由が特権の対象であるとして、証拠開示を避けようとしました。

2025年11月24日、アメリカ連邦地方裁判所のオナ・ワン判事は、OpenAIに対し、これらのデータセット削除に関する社内弁護士との通信記録や、弁護士・依頼者間秘匿特権を理由に黒塗りまたは保留されていたLibGenへの内部参照を含む文書をすべて提出するよう命じました。LibGenは著作権を無視して書籍データを配布していることで知られる「影の図書館」サイトで、Books1とBooks2はこのサイトからデータを取得して構築されたとされています。


ワン判事は、OpenAIの対応を「動く標的のように主張を変えるものだ」と厳しく批判し、決定文の中で「OpenAIは『不使用』という理由を述べた後に、証拠開示を避けるためにその『理由』は特権の対象であると主張することはできない」と指摘しています。その上で、OpenAIが「不使用」を理由として公に開示した時点で、その点に関する特権は放棄されたと判断しました。

この判断はOpenAIにとって極めて深刻な事態を招く可能性があります。原告である作家たちは、OpenAIが法的リスクを認識した上でデータを削除したこと、つまり著作権侵害が故意であったことを証明しようとしています。もし故意の侵害が認められれば、著作権法における法定損害賠償額は、侵害された作品1点につき最大15万ドル(約2310万円)にまで増額される可能性があります。


また、OpenAIは自身の行為が善意によるものであり、侵害の意図はなかったと主張していますが、ワン判事はこの点についても「OpenAIが『善意』を主張して法的責任を回避しようとする一方で、その善意の根拠となった弁護士からの助言内容を特権を盾に隠すことは、公平性の観点から許されない」と指摘しました。つまり、自身の潔白を主張するために「心の状態(state of mind)」を争点にするならば、その裏付けとなる法的助言の開示を拒むことはできず、特権は放棄されたとみなされます。

さらにワン判事は、OpenAIが引用したAnthropicに関する判例の解釈についても、「グロテスクなほど誤って伝えている」と厳しく非難しました。OpenAIは、海賊版サイトからのダウンロードであっても後の学習利用が公正であれば適法であるかのように主張しましたが、引用元のアルサップ判事は実際には「海賊版サイトからのダウンロードは、それ自体が本質的かつ救いようのない侵害である」と述べていたからです。

「AI企業が合法的に取得した書籍でAIをトレーニングするのに著者の許可は必要ない」という判決が下される – GIGAZINE


原告側の弁護士であるクリストファー・ヤング氏は、2024年12月の審理において、開発中のモデルにおける著作権侵害データの使用状況や、データセットの名前を変更して使用を継続している可能性について追及しており、今回の決定はこうした原告側の主張を後押しするものとなります。

ワン判事はOpenAIに対し、関連する内部文書を2025年12月8日までに提出すること、および社内弁護士に対する証言録取を12月19日までに実施することを命じました。OpenAIはArs Technicaの取材に対し、「判決には同意できず、上訴する意向だ」とコメントしています。

この記事のタイトルとURLをコピーする

Leave A Reply