本日翻訳して紹介するのは、the New Yorker のWeb版にのみ4月7日に掲載された Kyle Chaykaによるコラムです。タイトルは、”A.I. Pop Culture Is Already Here”(AI ポップ カルチャーはすでにここにある)となっています。短いコラムです。
Kyle Chayka はスタッフライターです。テクノロジー関連およびインターネット関連をカバーしています。さて、今回翻訳したコラムは、ネット上に投稿されたある動画がバズったことに関する考察でした。その動画のタイトルは、”ハリー・ポッター・バイ・バレンシアガ”(Harry Potter by Balenciaga)でした。
どういう動画がというと、映画「ハリー・ポッター」シリーズのキャラクターがゲッソリ痩せたモデル体型になって登場し、バレンシアガのジャケットなどを着てモデルをこなしているというものです。本物のファッションショーとは違ってセリフを言ったりしています。
まあ、はっきり言ってたわいないものにしか見えません。明らかにハリー・ポッターの本物の映画のシーンでは無いと分かりますし、本物のファッションショーでないことも分かります。作り物であることが容易に分かります。じゃあ、何でこの動画がバズったのか?それは、異質なもの2つを組み合わせた妙にあります。また、それなりに本物っぽい映像であることもバズった理由です。
また、この動画はAIを利用して生成したものであるということも特徴です。よくよく考えてみると、映画のキャラクターをモデル風にゲッソリ痩せさせて、それを動かして、動きに合わせて音声を被せる(リップシンク)させた動画を作るということは、つい最近まで素人では到底できなかったことです。ですので、素人でも、ポッターとバレンシアガを組み合わせるという妙を思いつければ、バズる動画を作成できるようになったのです。
さて、このコラムの要旨を記します。
- AIは異なる画像等を組み合わせて別のものを生成する能力が高い。
組み合わせることは、マッシュアップ(mushup)と呼ばれるが、これはAIが無いと難しかった。今では素人でもAIを活用して容易にマッシュアップをすることができる。 - 話題となった動画、”ハリー・ポッター・バイ・バレンシアガ”(Harry Potter by Balenciaga)は、3つのAIを使うことで比較的容易に作成された。
3つは、①キャラクターの静止画もしくはAvatarを生成するために使うAI(Midjourney)②キャラクターの音声を合成するAI(ElevenLabs)③静止画もしくはAvatarが動く動画を生成するAI(D-ID)です。 - しかし、ポッターとバレンシアガを組み合わせたら面白いのでは無いかということを思いつくのは、人間にしかできないこと。AIにはできない。
- バズる動画には2つ特徴がある。
異質なものを組み合わせた妙を感じさせること。それなりに本物っぽい映像であること。
前者の妙を感じさせる組み合わせを思いつくにはセンスが必要で、誰もが思いつくわけではない。 - 余談だが、You Tube でプロンプトジャングル(PromptJungle)という AIについて学べるチャネルを見ると、AIを使って画像を生成する方法などがよく分かる。
”ハリー・ポッター・バイ・バレンシアガ”のような動画を作ることも難しくはない。 - 既にネット上には、AIの手を借りた動画が氾濫している。それがなくては成り立たない状況である。
要旨ここまで。
では、以下に和訳全文を掲載します。詳細は和訳全文をご覧下さい。
- 1
- 2