Ⅲ.林産物( Forest Products )
猫を識別する木はあるが、猫の画像はないと想像して欲しい。ここで「生成( geherative )」AI の登場となる。
猫を識別できる木を使って猫の画像を作成する、という逆の作業が可能である。ランダムなピクセルのフィールド(今回は、雪の長方形)から始める。次に、その長方形を猫を識別できる木の下に滑り込ませ、猫が認識されるかどうかを確認する。その画像はランダムなピクセルだけなので、猫は認識されない。しかし、今度はそのランダムなピクセルをランダム化する。その結果、あなたにはまだ雪のように見えるが、木の中ではかすかな認識が呼び起こされるかもしれない。もしその木の認識度が上がるのが見えたら、その結果を維持する。もし認識度が減っていたら、この変更は捨てる。これを何度も繰り返す。やがて、雪の中から、猫が現れる。
(念のために言うのだが、通常の説明はここで説明したものとは少し違っている。実際には画像のノイズを取り除いたり加えたりすることを繰り返す必要がある。それは同じプロセスを私が説明したのと別な方法で説明しているに過ぎない。実際にファイルを削除するわけでもないのに画像を捨てると私が説明したのは、多くの人がノイズを加えたり取り除いたりするという抽象的な説明よりも、何かを捨てるという動作の説明の方が理解しやすいからである)
どんな猫が生成されたか?本物の猫ではない。それは、この作業を始めた時点に遡って、猫を識別できる木の訓練に貢献した猫の画像のいくつかをランダムに補間( interpolation )したものである。そのデータはネット上に公開された猫の画像から得られたものだが、新たに生成された画像は通常、それらと同じではない。ただ猫だと認識できる画像である。もう一度このプロセスを実行すれば、新しい連結( concatenation )が得られる。猫だけでなく様々なものに対して、このような画像を生成するように AI を訓練すれば、生成 AI の基本的な形ができあがる。