4.生成 AI が絡む法的紛争の頻発
知的財産の次なるフロンティアである人工知能( artificial intelligence )関連で法的紛争が引き起こされる可能性が高い。AI 関連でも司法的能力が問題である。おそらく判事の意見はバラバラで定まっておらず、必要な専門知識が備わっている者も少ないだろう。ベロスとモンタグは、著書の締めくくりで、人工知能が著作権の法的構造全体を崩壊させる技術になるかもしれないという興味深い示唆をしている。
歴史的に見れば、生成 AI( generative A.I. )は、著作権法の根幹を揺るがしてきた一連の技術革新の中でも最新のものである。写真は 1830 年代に発明されたが、ようやく 19 世紀中頃になって著作権が認められた。また、ラジオが発明された後には、音楽の権利保護を目的として演奏権を管理する非営利団体である全米作曲家作詞家出版者協会( the American Society of Composers, Authors, and Publishers :略号ASCAP )とラジオ放送会社との間で、紛争が発生した。楽曲をオンエアする際に、使用料の支払いが必要か否かが争われた(最終的には ASCAP が勝利)。また、複写(コピー)機も係争を引き起こした。論文や書籍をゼロックスのコピー機でコピーすることが著作権法上違法か否かが争点であった。では、6 行詩をコピー機でコピーした場合は違法なのか?結局のところ、コピー機でコピーしようと、手で書き写そうと同じことである。
インターネットは、誰もが著作物に自由にアクセスできる場所になった。また、それは著作権侵害の主張を回避するためのあらゆる方法を生み出した。1999 年に登場したナップスター( Napster:ファイル共有ソフト・サービス)は、その画期的な例である。ピアツーピア( peer-to-peer:サーバーを介さずに PC やスマホ等の端末同士で直接データのやり取りを行う通信方式のこと)のファイル共有システムは著作権を侵害すると判断された。それでもナップスターは大きな爪痕を残したと言える。音楽業界に革命を起こし、ストリーミングビジネスが隆盛する先駆けとなった。演奏して得られる収入は別として、現在、楽曲から得られる収入の大部分はライセンス契約によるものである。CD 販売によるものではない。ナップスターの試みを成就させたものがスポティファイ( Spotify )と言っても過言ではない。
一方、2015 年に判決が下された全米作家協会他対グーグル( The Authors Guild Inc., et al. v. Google, Inc. )裁判では、著作権者の許可を得ずに数千万冊の書籍をスキャンして電子化して作られたウェブサイトであるにもかかわらず、裁判所はグーグルブックスの合法性を支持した。その件では裁判さえ行われなかった。グーグルは、略式判決(正規の事実審理を省略して至る判決)でフェアユースの範囲内と認定され、勝訴した。控訴裁判所はグーグルブックスの書籍のフルデジタル化は「非常に変容的( transformative )」であると認められるので、フェアユースの認定を妨げるような他の判断要素の重要性が減少するとした。それで、著作権侵害には当たらないと判断した。この結果は、AI を使用する企業に対する著作権侵害訴訟を起こす当事者にとって、困難を予感させるものである。
それでも、裁判所が現在の法定権限( 1976 年に制定され、何度も改正されてきた著作権法)を、 1976 年当時には出現することを誰も予測していなかった技術である生成 AI にどのように適用するかは誰にも分からない。チャット GPT のようなアプリは大規模言語モデル( large larning model:略号LLM)であり、膨大な量のデジタル情報を扱うことで学習する。大規模言語モデルが学習しているのは、文章ではなく、トークン( token:単語をはじめとする言語の最小単位)である。正しく機能すれば、大規模言語モデルは統計的な計算に基づいて、次にどんなトークンが来るかを予測できる。
これは単なる自動入力( autofill )の進化形と捉えられ、あまり重要視されてこなかった。しかし、私も文章を書く時に、次にどんな単語で文章を埋めていくべきかを推測している。ただ、自動的に( auto )埋めているという感じはしない。大規模言語モデルとの大きな違いの 1 つは、私には自分自身が作家であるという自負があるので、統計的に最も一般的な解決策は可能な限り避けることである。
大規模言語モデルは、言語の特性やタスクの要件に応じて、適切なトークン化手法を選択し、データを適切なトークン列( token sequence )に変換する必要がある。学習したトークン列のかなりの割合が、著作権で保護されている報道機関のウェブサイトからのものだと考えられている。大規模言語モデルはまた、ライブラリー・ジェネシス( Library Genesis )や Z ライブラリー( Z-Library )のような、いわゆるシャドウライブラリー( shadow library:通常は隠されているか、すぐにアクセスできないコンテンツをすぐに利用できるオンラインデータベース)にあるテキストでも学習していると考えられている。ここで法的観点から問題となるのは、大規模言語モデルが学習する過程で、これらのテキストが丸ごとコピーされているかどうか、またコピーされた場合、このプロセスの一部あるいは全部がフェアユースと判断されるかどうかという点である。
知的財産に詳しい専門家の間でも、その答えについては完全に意見が分かれている。これについては、現在も複数件の係争が法廷で繰り広げられている。おそらく各地の裁判所が下す判断は、それぞればらばらで一貫性のないものとなるだろう。厳密に法律に照らせば、合衆国憲法修正第 1 条の規定に則り連邦議会がルールを決めるべき分野であるが、最近の議会は立法機関の役目を十分には果たせていない。
既に最高裁は、グーグルや Bing のような検索エンジンは、ウェブ上の膨大な著作物を精査しており、検索時に表示されるサムネイル画像やスニペットは 「変容的( transformative )」 であるとし、フェアユースに該当するという判決を下している。この点で、生成 AI は検索エンジンと大きく異なるものなのか否かということは、判断が難しいところである。
コメディアンで作家のサラ・シルバーマ ン( Sarah Silverman )と他の2人の作家は、テック企業のメタ( Meta Platforms )とオープン AI( OpenAI )を著作権侵害で訴えた。しかし、AI の訓練に著作物を使用したのは著作権侵害に当たるという原告の主張を除き、すべての請求が棄却された。また、著名作家のジョン・グリシャム( John Grisham )とジョディ・ピコー( Jodi Picoult )もオープン AI を著作権侵害で訴えている。他にも訴えている者はたくさんいる。作家たちがどのような救済を求めることができるかは明らかではない。シルバーマンが過去に出版した回顧録は著作権によって保護されている。他の誰かが実質的に類似した作品を出版することはできない。しかし、大規模言語モデルにとっては、彼女のテキストはデジタルデータの海の一滴にすぎない。グリシャムやピコーのような有名なベストセラー作家は、大規模言語モデルによって損害を被っているかもしれない。しかし、それはそれほど大きいとは思えない。むしろ、大きな損害を被っているのは、自費出版でせっせと DIY 入門書などを出しているような作家たちである。AI は、言語や画像からなるオンライン上の全ての著作物を学習しているため、創作活動をしている者であれば、誰でも(自撮り写真やキムチ鍋のレシピを投稿しているだけでも)著作権が侵害されたとして訴訟を起こせる可能性がある。大規模言語モデルは、誰でも裁判を起こせるトークンを配っていると言える。
訴訟は後を絶たない。昨年 2 月に、ゲッティイメージズ( Getty Images )は スタビリティ AI( Stability AI )に対して訴訟を起こした。激しくスタビリティ AI を非難していて、対価を一銭も払わず衝撃的な規模で著作権を侵害していると主張した。そして同年 12 月には、ニューヨーク・タイムズ紙( Times )がオープン AI 並びに同社と資本・業務提携するマイクロソフトを著作権侵害を理由に提訴した。両社がニューヨーク・タイムズ紙のアーカイブを使用したことによる被害額は数十億ドルであるとし、損害賠償を求めている。
ニューヨーク・タイムズ紙が例として挙げたのだが、オープン AI のチャット GPT を使用しているマイクロソフトの検索エンジンである Bing は、同紙のワイヤカッター( Wirecutter:同紙の運営する商品レビューサイト)のコンテンツをそのままコピーして提供しているという。同紙は、ワイヤカッターの閲覧者を推奨商品の販売サイトへのリンクを辿らせて誘導することで収益を上げている。技術的な話をすると、Bing が使っているチャット GPT がワイヤカッターのコンテンツを認識しており、そのコンテンツとそっくりそのままのコンテンツを生成している。Bing で検索して、生成されたそのコンテンツにたどり着いた場合、そこには商品の販売サイトへのリンクが貼られていない。そのために同紙は損失を被った可能性があるという。
このような著作権に関わる法的紛争のいくつかは、ライセンス契約によって対応することができる。音楽業界はナップスターが登場した際にライセンス契約を上手く使って対処した。AP 通信は、チャット GPT に過去の記事を学習用に使用できるライセンスを与えることに合意した。多くの企業がライセンス契約を締結すべく協議中とされており、すでに締結済みのところも少なくないようである。また、クリエイティブな職場での AI による著作権侵害を防ぐためのガードレールは、ストライキ等を通じて構築可能かもしれない。昨年の秋、1 万 1,000 人以上の脚本家が加入する全米脚本家組合( the Writers Guild of America )と映画俳優組合( the Screen Actors Guild )がストライキを起こして、最終的には合意に達することができた。私のような週刊誌記者もストライキを起こしてガードレールを構築することはできるのだろうか。
もう 1 つ疑問がある。それは、AI によって創作された著作物の著作権が保護されるかどうかである。昨年 8 月、ワシントン DC の連邦判事は、人工知能( AI )によって創作された著作物には著作権がないとの判断を示した。判決文によれば、人間が著作者であることが著作権の必須要件であるという。この判決はすぐに試されることとなりそうである。結局のところ、カメラは単なる機械でしかなく、撮影する人間が著作権者なのである。裏庭から花火大会をライカで撮影すれば、私の写真は著作権保護の対象となる。しかし、OpenAI のサービスであるダリ・スリー( Dall-E 3 )に花火の写真を生成するように指示した場合、その画像の著作権は保護されない可能性が高い。この差はどこから来るのだろうか。
昨年、テキサス州に住むダスティン・バラード ( Dustin Ballard )なる人物が AI に生成させたテイラー・スウィフト( Taylor Swift )の楽曲を歌うジョニー・キャッシュ( Johnny Cash )の動画をネット上に投稿した。それは、大人気となった。しかし、それは誰のものなのか?テイラー・スウィフトは訴えることができるのだろうか?カバーして上げただけなので、おそらく無理だろう。キャッシュの著作権管理者は著作権侵害を主張しているのだろうか?スタイルや声に著作権はないから、間違いなくしていないだろう。では、ダスティン・バラードに著作権があるのか?彼は作曲も演奏もしていない。ということは、誰にも著作権が無いのか?世界中の人々の共有の財産なのか?
AI はコモンズ(共有の財産)を盗用すると言う人がいるかもしれない。しかし、AI は私が詩を書く時にすることと同じことをしているだけである。AI は、これまでに出会った膨大な量の詩を見直し、それらを参考にして新しい詩を生成する。AI は私よりもはるかに多くの詩を「記憶( remembers )」し、私よりもずっと素早く新しい詩を作る。私たちが膨大な古い詩を読むのには、何の許可もいらない。チャット GPT がそれをする際に許可が必要であるなら、それは少し矛盾している。人間なら誰でもすることを、チャットボットがより効率的に行うからといって、罰することはできないのではないか。AI の学習を制限したら、凡庸な詩しか生成しなくなるだろう。それは、私が作る詩と同じようなレベルかもしれない。
AI が今後どうなっていくかは見通せないわけだが、AI がもたらす脅威に現行の著作権法は十分な対処ができないだろう。現在、私たちが目にしている著作権を巡る争いは、全て金銭に関するものである。ライセンス契約、著作権保護、雇用契約等々、これらはすべて知的財産の所有権という法的虚構( legal fiction )の上に成り立っている。そして、それらによって一部の当事者が他の当事者よりも大きな分け前を与えられるという、非常に複雑で不合理な規制体制が形作られている。AI が存在する世界で生きることは、弁護士にとって非常に良いものになるだろう。もちろん、彼らが AI に取って代わられなければの話だが。♦
以上