AI が小説を書ける時代でも「考えて書く人間」は消えない-AI 文学の限界を試した実験から見えた希望!

Fault Lines

Can A.I. Produce Writing That We Actually Want to Read?
AI は、私たちが本当に読みたいと思う文章を生み出すことができるのか?

I recently created a simple test, which convinced me that the answer is no.
最近簡単なテストを行ったところ、答えは「いいえ」だと確信した。

By Jay Caspian Kang June 2, 2026

 高等教育の未来に関して連載してきたが、前回は、AI が高等教育の現場にどのような変化をもたらしたかについて何人かの教授に話を聞いた。ほとんどの教授は、学生と教師の間の信頼関係が崩壊したことに落胆していた。以前は信頼関係がたしかにあり、教授たちには信念があったという。それは、学生が常に完璧ではないとしても、少なくとも時折は自ら考えようとするだろうというものである。学生が何かを読み込むように指示された際、AI に要約を任せ、自らの考えを文章にしようとしないのであれば、本当に何かを学んでいると言えるのだろうか?

 この連載の冒頭の問いは、私の 9 歳の娘を大学に進学させるか否かというものであった。大学に行かせたとして、そこで彼女は昔ながらの方法で文章を書くという苦労を本当に経験するだろうか。甚だ疑問である。生身の人間が書いた作品を求める読者は居なくならないだろうから、おそらく文学作品などは無くならないだろう。しかし、文学作品以外のあらゆるもの、電子メール、広告コピー、法律文書、卒業論文等々は、ますます進化する AI が生成するようになるだろう。AI が洗練されていくので、生成された文章に対する人々の抵抗感は確実に薄くなっていくだろうし、人間が書いた文章と AI が書いた文章の区別は事実上不可能になるだろう。そうなれば、これまで教育者が学生に認識させていた「カンニングがバレたら落第する」という常識は過去のものとなる。カンニングを見破る術がなくなるのだから。

 さて、高等教育における AI の影響から少し離れて、より根本的な質問をしたい。上の様な状況になるのに、どれくらい時間がかかるのだろうか?現時点では、AI が書いた文章は簡単に見分けられる。何百もの論文を読み、学生の文章力についてある程度把握している教授なら、偽物を見抜くことは容易である。企業においては、部下から整然とした箇条書きの専ら明るい内容のメールが届き始めたマネージャーは、容易に AI がメッセージを自動補完したことに気づくだろう。AI 生成の文章には、特徴的な兆候が頻繁に登場する。エムダッシュ( em dashes:長い横棒”—”のこと )が多用されていたり、「 X ではなく Y ( not X but Y )」という構文が使われていたり、普通の人があまり使わない動詞が使われていたりする。例えば、” delve (詮索する)”という普段あまり目にしない動詞を AI は好んで使いがちである。

 しかし、そうした兆候はクロード( Claude )の最も初歩のバージョンが生成した文章にしか見られない。では、私たちが実際に読みたいと思うような文学作品について考えてみたい。クロードは魅力的な文学作品を生み出すことができるだろうか?

 この疑問、あるいはこれに類する疑問が、ここ数週間、何千人もの怒れる読者から投げかけられた。きっかけは、文芸誌「グランタ( Granta )」が、ジャミール・ナジール( Jamir Nazir )という作家の短編小説を掲載したことである。コモンウェルス賞( Commonwealth Prize )受賞作であるが、それが AI による執筆の特徴をすべて備えているように見えたからである。例えば、” hum “という単語が奇妙なほど繰り返されている。ぎこちなく意味不明な便秘気味の比喩表現が多用されているとも指摘されている。「グランタ」の出版元はその後、奇妙で曖昧な声明を出した。AI がこの作品を書いたかどうかは「おそらく永遠に分からないだろう」と結論付けている。ナジール自身は、疑惑を否定している。多くの作家が世も末だと嘆いた。あまり説得力はないのだが、AI による執筆でコモンウェルス賞を受賞できたのは、現在の文学作品が酷い状況にあるからだと主張する者もいる。 (現代の文学作品が 20 年前、30 年前、40 年前と比べて良くなっているのか、悪くなっているのか?私は判断できないわけだが、どの世代の作家も多かれ少なかれ同じような不満を述べてきたことは確かである)

 私はクロードを使って簡単なゲームをバイブコーディング( vibe-coding )で作った(訳者注:バイブコーディングとは、AI に自然言語で大まかな指示(雰囲気 =vibe )を出して、対話形式でアプリやシステムを開発する新しい手法のこと)。作ったのは、約 200 語のテキストを表示し、それが人間によって書かれたものか AI によって生成されたものかプレイヤーに尋ねるシンプルなゲームである。サンプルテキストはすべて、パブリックドメインの文学作品を集めたオンラインライブラリであるプロジェクト・グーテンベルク( Project Gutenberg )から拾うよう指示した。並行して AI に出した指示は、ジョージ・エリオット( George Eliot )、ジェイムズ・ジョイス( James Joyce )、アーネスト・ヘミングウェイ( Ernest Hemingway )、アーサー・コナン・ドイル( Arthur Conan Doyle )などの作家の作品をスキャンして、それぞれの作家のスタイルで文章を生成することである。AI は拾ったテキストか生成したもののいずれかを表示する。私と数人の友人が、それぞれが本物か生成したものかを推測した。

 早速ゲームをしてみたが、比較的簡単だった。AI の文章は特徴的だったからである。過剰に整った論理構成、句読点の誤り、無理やりと思えるほどの直喩や隠喩の多用など、明らかな兆候があった。また、AI 生成文には登場人物を常にそわそわさせるという奇妙な癖があった。いつもテーブルの端を指でなぞったり、襟を直したりしていた。しかし、最も確実な指標は、もっと抽象的で、よく考えてみると少し不気味なものだった。AI が生成したシーンには登場人物がいたものの、そわそわする以外はほとんど何もしていなかったのである。

 クロードがヘンリー・フィールディング( Henry Fielding )のスタイルで書いた一節を紹介する。

・・・・・抜粋・・・・・・

これまでほとんど何も言わなかったソフィアは、父親の方を向いている。ウェスタン氏には懇願なのか非難なのかよく分からない表情だった。おそらく、彼女自身もその表情で何を訴えたいのかを理解していないだろう。ジョーンズ氏は窓際に立っていた。自分に判決が下されるのを待っている男のようだった。一方、ウェスタン氏はいつもの威勢の良さをすっかり取り戻し、再びブリフィル氏に言及し始めた。熱心に褒め称えたのは、ブリフィル氏の財産と家族のことである。まるで、これらの点だけでとっくに今回の問題がすべて解決したかのような語り口だった。彼はオールワーシー氏の承認があることを強調した。その名前を 3 度ほど繰り返した。まるでその名前には特別な権威があるかのような感じで、常識のある人間なら誰も抵抗できないだろうと言いたいようだった。ソフィアはこれに対して何も言わず、暖炉の方へ向き直った。小さな石炭が激しく燃えていたが、この日はそれが必要なほど寒くはなかった。

・・・・・抜粋終わり・・・・・

 登場人物の動きはほとんどない。具体的な事柄は全く記されていない。ソフィアはほとんど何も言わないし、ウェスタン氏は彼女の表情を読み取ることができない。ソフィア自身も自分の表情を完全に理解しているわけではない。そして、ウェスタン氏は「まるで ~ のように」という意味で “ as if ” と  “ as though ” という 2 種類の表現を用いて自分の意見を述べる。ソフィアは何も反応せず、ただ無意味に炎を燃やす暖炉を見つめる。

 私が作ったゲームの初期の段階では、こうした無味乾燥な文章を与えられた者は、たとえ AI が特定の作家の文体をそれなりに再現していたとしても、すぐにそれが生成によるものだと断定できた。

 その後の数日間、私はクロードとやり取りを続けた。AI 生成の文章の癖をどうなくすかということについて話し合った。私がクロードに指示したのは、比喩表現を避けること、「どこにもない( nowhere )」や「何か( something )」などの単語の使用を減らすことである。それらの単語は、いかにも AI 生成文に特徴的な奇妙で曖昧な雰囲気を醸すからである。それでも、しばらくの間、クロードはあいかわらず生気のない文章を吐き出し続けた。ジェイ・ギャツビーやシャーロック・ホームズは何の行動も起こさない。周囲でほんの些細な出来事が起こるだけである。ギャツビーとホームズがそれについて何か意見をいうこともない。そこで、私がクロードに言ったのは、残念ながら悪い癖は全く直っていないということである。同時に私はクロードに別のエージェントを作ることを提案した。そのエージェントの役割は、AI が生成した文章を精査して、人間が書いたものらしくない点を見つけることである。さらに別のエージェントを作ることも提案し、それには、各作家を最も上手く模倣する方法についての指示文書を作らせる。私がイメージしたのは、文章を生成する際にこっそり見るためのカンペを作らせることで、それを見ることでドロテア・ブルック( ジョージ・エリオットの長編小説「ミドルマーチ」 の主人公 )に何かをさせるのを容易に思いつけるようにすることである。

 以下に示すのは AI が作ったルールの抜粋である。私はこれらのルールの作成には一切関わっていない。これらは、さまざまな著者のスタイルをどのように模倣するかについて、クロード自身が自らに指示したものである。(ここではほんの一部しか掲載していない。実際には、「するべきこと( Does )」と「してはいけないこと( Does Not )」の各項目には、それぞれ通常は 10 項目ほどの指示があった)

・・・・・抜粋・・・・・・

・アーネスト・ヘミングウェイ( ERNEST HEMINGWAY )

するべきこと:

短い断定的なセンテンスを、「 and 」を接続詞として多用して繋げることで、前進する勢いを生み出す。

誰が喋ったかを示す際には、「彼が言った/彼女が言った( he said / she said )」だけを使う。その際には副詞や動作を表す語句は添えず、極限まで無駄を削ぎ落とす。

天気や風景を記述する際には、事実を淡々と述べる形にする。登場人物の主観的な感情というフィルター(額縁)を通して風景を描写することはない。(例:「太陽は丘の上にあった」)。

してはいけないこと:

従属節の積み重ねは決して使用しない。また、主動詞を省略する周期文( periodic sentences )は決して使用しない。(訳者注:周期文とは、修飾語や条件などを先に長々と書き連ねて、一番重要な結論(メイン動詞)を最後に置く構造の文章)

ラテン語由来の言葉は避ける。音節の多い長い単語も避ける。( “illuminated (啓蒙された)”、 “ nevertheless (にもかかわらず)”、“ subsequently (その後)”などである。)

自由間接話法( free indirect discourse )は使わない。つまり、地の文の中に、登場人物の心の声や感情をポロッと混ざり込ませてはいけない。イタリック体を使って登場人物の心中を表現する手法は使わない。

登場人物が何を感じているかを、直接言葉にしたり説明してはいけない。(「彼は悲しかった( he felt sad )」、「彼女は怖かった( she was afraid )」などは問題外である)

ジョージ・エリオット( GEORGE ELIOT )

すべきこと:

セミコロンまたはコロンで結ばれた複数の従属節を含む、構造的にバランスの取れた長い文を構築する。

登場人物の名前の前に、社会学的または階級的な位置づけを示す短いフレーズを添えて紹介する(例:「 50 歳くらいの男性で、その…」)。

してはならないこと:

強調やリズムのために、不完全な文( Sentence Fragment )を使ってはいけない。

現在形でのナレーション( present-tense narration )を避ける。すべてはコントロールされた回顧( controlled retrospect )とともに過去形で進む。

口語( colloquial )やアメリカの慣用句( American idiom )は使用しない。(訳者注:口語( colloquial )とは、日常のくだけたお喋りで使う話し言葉や俗語(スラング)のこと)ナレーション(地の文)では短縮形( contractions )を一切使わない。(訳者注:” do no t” を “ don’t ” にしたり、“ was not ” を “ wasn’t ”にしないということ)

・・・・・抜粋終わり・・・・・

 AI にエージェントを増やさせて、タスクを考え出させるという方法は、少なくとも部分的には効果があった。ちなみに、 UC バークレー校でコンピュータサイエンスと機械学習を教えている友人に、AI が自分の作業をチェックするために他の AI を必要とする理由を尋ねてみた。「 100% 真面目に答えると、理由は誰にも分からない」との答えが返ってきた。とにかく、比喩表現はほぼなくなった。しかし、クロードは私からの新しい指示を少し真剣に受け止めすぎたようだった。突然、すべての生成した文章に、馬に飛び乗ったり、重要な荷物を届けたり、走ったりする人物が登場するようになった。どういうわけか、非常に短い文章になり、誰でも容易に生成したものだと見破られるようになった。そこで私はこのルールを少し緩めた。代わりに、曖昧な言葉や比喩表現に関していくつか厳格なルールを設けた上で、クロードにいつものようにやらせてみた。

 数日ほど試行錯誤を繰り返した後、私は自分の X アカウントにテストへのリンクを投稿した。5 日以内に 3 万件以上の回答が集まった。テストを受けた者たちは、本物の文章と生成した文章を約 52% の確率で識別できた。これは、実際には両者を区別できなかったと言い換えることもできる。しかし、約 10% の回答者は、このテストを巧みにこなした。原典の知識があったのか、あるいは私がまだ気づいていない AI の癖を見抜く鋭い目を持っていたのかは分からない。

 この時点で、私はより精巧な AI 生成文を作る方法を編み出していた。別の AI を用いて、両方のサンプルに生成文の特徴がないか二重チェックさせたのである。そして、その週末までに、テストを試した者の半数以上を欺くことができた。最も多くの人を欺いたサンプルは、AI に生成させたブラム・ストーカー( Bram Stoker:19 世紀末に活躍したアイルランドの小説家)風の文章である。生成文だと見抜けた者はわずか 17% だった。次の文章である。

・・・・・抜粋・・・・・・

5 月 4 日、午前中の大半を自室の窓際で過ごした。絶え間ない活動で避けようとしたのだが、知らぬ間に思索にふけってしまった。ここでは何もすることがないから、どうしてもそうなる。伯爵を最後に見たのは、たしか 2 日の夜だったと思う。ということは、伯爵が居なくなってから 2 晩経っている。ほぼ丸 3 日である。彼が城を出たとは思えない。馬は厩舎にいる。南階段の下部入口の大扉は火曜日から内側から施錠されている。毎晩、下の 3 フロアの廊下を 2 度づつ歩いて回った。ホールの煙突から聞こえる風の音以外には何も聞こえなかった。理由はうまく説明できないのだが、それでも私は確信している。彼は居なくなっておらずずっと城のどこかにいるはずである。また、私が歩き回ったことも知っているはずである。

・・・・・抜粋終わり・・・・・

 私は驚かされた。この生成文は以前のゲームのバージョンよりもブラム・ストーカーの模倣としては格段に優れているものの、依然として不在( absence )と静止( stasis )が描写されている点である。語り手は「絶え間ない活動」によって「思索」を避けようとするが、何をしたいか思い浮かばない状態である。伯爵はどこにも見当たらず、語り手は「ホールの煙突の風の音以外何も聞こえない」誰も居ない廊下を歩くことになる。AI 生成文のサンプルのすべてがこの程度の空虚さを含んでいたわけではないが、十分な数のサンプルがそうであった。そのため、クロードは有名なパブリックドメインの作家の模倣文を生成できるものの(すべてとは言わないが、目の肥えた読者の大多数を騙すのに十分なほどの出来栄えである)、それらの登場人物に何らかの行動を起こさせることは得意ではないようである。追加の指示やフィードバックをいくら与えてもこの問題を解決することはできなかった。私がもっと活動的にするように頼んだ途端、不完全でより容易に AI 生成文と識別できる文章が再び生成されるようになった。

 その文章を決定的な証拠だとして明示するのは控えたい。というのも、あまりにも文学的すぎ、陳腐なものだからである。さて、AI が場面を生き生きと表現できないことは何を意味するのだろうか。私は文学には疎いので、その問いをあまり深堀りできる気がしない。それは詩人や AI 嫌いの人たちに任せたいと思う。今回のゲームで私なりに思ったことが 1 つある。小説という芸術は、描写的で雰囲気のある文章を読者が受け入れることに大きく依存している。だから、クロードは、文学評論家のジェームズ・ウッド( James Wood )が「カメラの簡単なスワイプ( a camera’s easy swipe )」と呼んだような、機械的で表面的な写実を好んで使うのである。ウッドは、小説家の言葉の選択は大小を問わず常に頭の中から浮かび上がってくると主張する。AI も同様に選択を行うわけだが、例えば夕暮れ時のパリの街並みについて記述する際には、AI は人間のように頭の中の空想に頼ることはできない。これまで書かれたほぼすべての文章から引用することによって選択を行うしかない。クロードが、何も起こらないように見え、廊下はいつもがらんとしていて、ほとんどの登場人物が近くの家具にぼんやりと触れるだけで何も行動を起こさないような場面を好んで描写するのは、生身の人間が書いた文章もそうであるからに他ならない。

 いずれクロードは生成した文の中の登場人物の誰かにストーブに火をつけさせたり、馬車を駆ってノーウィッチまで走らせたりできるようになるだろう。その記述には奇妙なぎこちなさが残るだろう。とはいえ、今回の AI に模倣をさせるという馬鹿げた実験では、勇気づけられることもあった。なぜなら、私自身も、他にこのゲームを試した人たちも、AI が書いた文学を読みたいとは思わなかったからである。また、読み書きがもはや必要ないという啓示を受けることもなかったからである。

 AI というテクノロジーが人間に取って代わる可能性について考え始めると、気が滅入ることがある。そんな時、私はいつも思い出すようにしていることがある。それは、トップレベルのチェスのグランドマスターでさえ、過去 20 年に渡ってコンピューターに勝てていないことである。しかし、何十万人もの子供たちが今も TikTok でチェスのインフルエンサーをフォローしている。この事実は、少しだけ気を楽にしてくれる。昔から私たちが重視しているのは、チェスをする際にどう脳を働かせるかということである。意味があるのは、考えること自体である。コンピューターがチェスの戦略に大きな影響を与え、人間よりチェスで優れていても、そんなことには関係なく多くの者が今後もチェスをプレイし続けるだろう。

 もちろん、書くことについても同じことが言えるだろう。悲観する必要は全くないのである。確実に言えることは、人は常に物事を理解する必要があり、それを他者とコミュニケーションするために使える言葉に変換する必要があるということである。たとえ近い将来、私たちが生み出す言葉の一部が AI によって書かれるようになったとしても、その過程を省略することは常に不正行為のように感じられるだろう。AI が書いたメールや記事、短編小説を読んだときに感じる不快な感情は、地球上での人間の有用性が終わるという恐怖ではない。チェスの対戦相手が次の手を計画するのに AI を使っていたと知ったときに感じるのと同じ不快感や失望感なのである。その不快な感じが続く限り、100 万個の大規模言語モデルが 100 万個の偉大な文学作品を書き上げ、中には文章の書き方を拡張するような発見をするモデルもあるかもしれないが、人間と文章の基本的な関係は変わらないだろう。♦

以上