1. TOP
  2. お役立ちコンテンツ
  3. お知らせの記事一覧
  4. Anthropic『プロジェクト・パナマ』発覚──油圧カッターで本を切断、数百万冊スキャンの全貌

Anthropic『プロジェクト・パナマ』発覚──油圧カッターで本を切断、数百万冊スキャンの全貌

2026年1月、Washington Postの報道により、AI企業Anthropicが秘密裏に進めていた「プロジェクト・パナマ」の実態が明らかになりました[1]。油圧カッターで書籍の背表紙を切断し、数百万冊をスキャンした後に廃棄するという衝撃的な手法は、AI開発における倫理的問題として世界中で議論を呼んでいます。しかし、この事件が本当に示しているのは、企業の倫理観の欠如だけではありません。むしろ、著作権法が持つ構造的な欠陥と、資本力を持つ企業がそれをいかに巧みに利用しているかという現実です。本記事では、プロジェクト・パナマの全貌と、AI業界全体に共通する著作権回避の手法について解説します。

プロジェクト・パナマの全貌

数百万冊を「破壊的スキャン」した背景

2024年初頭、Anthropicは「世界中のすべての本を破壊的にスキャンする」という野心的な計画を開始しました[1]。内部文書には「このプロジェクトに取り組んでいることを知られたくない」と明記されており、秘密裏に進められた実態が明らかになっています。

この大規模作戦の背景には、AI学習に必要な高品質データの枯渇という深刻な問題がありました。Anthropicの共同創業者は、書籍が「AIにうまく書く方法を教える」ために不可欠であり、「低品質なインターネット言語」を模倣させないためには書籍が必要だと考えていました[2]。実際、同社は数千万ドルを投じて中古本販売業者Better World BooksやWorld of Booksから大量購入し、油圧式カッターで背表紙を切断、高速スキャナーでページをデジタル化した後、リサイクル業者に残骸を送っていたのです[3]。

ベンダー提案書によれば約6ヶ月間で50万冊から200万冊の書籍をスキャンする計画でした[3]。この「破壊的スキャン」は、Google Booksのような保存を前提とした従来の大量デジタル化プロジェクトとは一線を画し、速度と独占性を優先したアプローチだったと言えます。

Google Books出身者を招聘した戦略

Anthropicがこのプロジェクトを実行するために雇ったのが、Tom Turveyという人物です[4]。彼はGoogle Booksを作るのを助けた元Google幹部であり、20年前に著作権をめぐる法的論争を経験しながらも、最終的に裁判所からフェアユース(公正利用)の判断を勝ち取った実績を持つベテランでした。

この人事は偶然ではありません。Google Booksは2015年、控訴裁判所から「変容的(transformative)」な利用であるとしてフェアユースの判決を受けており[5]、Anthropicはこの先例を活用する戦略を取ったのです。実際、2025年6月のAlsup判事の判決では、合法的に購入した書籍をAI学習に使用することは「極めて変容的」でありフェアユースに該当すると認められました[6]。

ただし、Anthropicは当初、ライセンス交渉を避けるためLibGenなどの海賊版図書館から700万冊以上をダウンロードしていました[7]。CEOのDario Amodeiが「法的・実務的・ビジネス上の苦労」と呼んだライセンス交渉を回避した結果、法的リスクが高まったため、2024年に物理的な書籍購入へと方針転換したのです[3]。

著作権法の抜け穴を突いた合法的手法

第一販売の原則(First-Sale Doctrine)の悪用

Anthropicの戦略を理解する上で重要なのが、米国著作権法における「第一販売の原則(First-Sale Doctrine)」です。この原則は1908年のBobbs-Merrill判決に遡り、合法的に購入した書籍を転売、貸与、廃棄する権利を消費者に保障しています[8]。

この原則は本来、個人の読者や図書館、古書店を保護するために設計されました。しかし、AI学習という大量消費の文脈では逆説的に機能します。資本力を持つ企業は大量に書籍を購入し、破壊的スキャンによってデジタル化し、フェアユースを主張することで創作者へのライセンス料支払いを完全に回避できるのです。Alsup判事はこれを「スペース節約のためのフォーマット変換」と評価し、フェアユースと認定しました[9]。

15億ドル和解が示す業界の構造的問題

Anthropicは最終的に、海賊版書籍のダウンロードに関して15億ドルという米国史上最大の著作権和解に合意しました[11]。この金額は一見巨額に見えますが、同社の評価額1,830億ドルの1%未満に過ぎません[12]。

さらに注目すべきは、和解対象となった約50万冊の書籍について、著作者と出版社が受け取る補償が1冊あたり約3,000ドルと推定されている点です[13]。この金額はAI企業にとって「ビジネスコスト」の範囲内と言えるでしょう。

重要なのは、判決がAI学習そのものをフェアユースと認めた点です。Jones Walker法律事務所の弁護士は「データの取得方法が利用方法と同じくらい重要」と要約していますが[14]、第一販売の原則が「合法的な取得」を可能にすることで、創作者の権利を無効化する構造が明らかになりました。

Meta、OpenAIも同じ道を辿った理由

LibGenからの大量ダウンロードという共通点

Anthropicだけが海賊版図書館を利用していたわけではありません。2025年、裁判所の文書開示により、Metaが81.7テラバイトもの海賊版書籍をLibGen、Z-Library、Anna’s Archiveからトレントでダウンロードしていたことが明らかになりました[15]。

内部メッセージでは、Meta従業員が倫理的懸念を示しながらも、「最先端(SOTA)の数値達成にはLibGenが不可欠」という判断から、CEOのMark Zuckerbergの承認を得て実行に移したことが記録されています[16]。ある従業員は「海賊版資料を使うべきではない」と述べ、別の従業員は「海賊版資料の使用は我々の倫理的閾値を超えている」と警告しましたが、経営陣の判断が優先されました[15]。

OpenAIも同様の行為を行っていたことを認めています[17]。著名作家のJohn Grisham、George R.R. Martinらが起こした集団訴訟では、OpenAIが許可なく著作物をコピーしたと主張されており、訴訟は現在も継続中です[18]。業界全体が「海賊版ダウンロード→法的リスクの認識→合法的購入への転換」という同一の軌跡をたどっているのです。

資本力が決める著作権回避の可否

この戦略が成功するか否かは、資本力によって決まります。数千万ドルを投じて大量の書籍を購入できる企業は合法的にデータを取得でき、そうでない企業は海賊版に頼らざるを得ません。Alsup判事の判決は、前者を合法、後者を違法と明確に区別しました[6]。

結果として、著作権法は創造者を保護するどころか、資本力を持つ企業の法的抜け道として機能しています。The Conference Boardが警告したように、15億ドルの和解金は将来的な違反行為を抑止するには不十分であり[12]、法改正なしには同様の問題が繰り返されるでしょう。

さいごに

プロジェクト・パナマが浮き彫りにしたのは、著作権法が20世紀的な物理的所有権の概念に基づいており、21世紀のデータ経済における大量デジタル化には対応できていないという現実です。油圧カッターで切断された数百万冊の書籍は、単なるAI企業の野心の残骸ではなく、法制度の限界を示す証拠と言えます。

AI技術の発展は社会に大きな恩恵をもたらす可能性がある一方で、その基盤となるデータ取得のプロセスが創造者の権利を軽視している現状は看過できません。この問題を単なる法的論争としてではなく、イノベーションと権利保護のバランスをどう取るべきかという根本的な課題として捉える必要があります。今後、AI活用を検討する際には、データの出所と権利関係についても十分に配慮することが求められるでしょう。

出典

この記事を書いた人

Default Author Image

Yuji Oe

ソリューションサービス事業部

10年以上の業界経験(主にデータベース分野)を生かし、現在はSmart Generative Chatの導入のプロジェクトマネジメントを中心に活動。

DXを
「一気に進める」なら
SGC

無料トライアルのご紹介

トライアル

SGCは1週間の無料トライアルをご利用いただけます。
DXの全体像を把握し導入のイメージをつかむためにも、ぜひご利用ください。

サービスに関するお問い合わせ、
資料のご請求はこちらから承っております

資料請求