ロボットの学習方法の革命!AIのように強化学習できれば、人間ができることは全てできるようになる!

6.

 コンピューター科学者たちはかつて、例えば英語とフランス語、フランス語とスペイン語の間の翻訳を行うためのさまざまなモデルを開発していた。最終的には、どの言語のペアでも翻訳できるモデルに収束した。それでも、翻訳は音声文字変換や画像認識などとは異なる問題と考えられていた。それぞれに専門の研究チームや開発企業があった。その後、大規模言語モデルが登場した。衝撃的なことに、大規模言語モデルは言語を翻訳するだけでなく、司法試験に合格したり、コンピューターコードを書いたりすることもできた。寄せ集めが 1 つの AI に溶け込み、学習が加速したのである。ChatGPT の最新バージョンは、あらゆるトピックについて数十の言語で声を出して話しかけ、歌を歌い、さらには声のトーンを判断することもできる。できることはすべて、個別のタスク専用のスタンドアロンモデルよりも優れている。

 同じことがロボット工学でも起こっている。ロボット工学の歴史の大半において、視覚、プランニング、運動、あるいは本当に難しい器用さといった狭いサブフィールドについて、1 冊の論文を書くことができた。しかし、GPT-4 のような 基盤モデル ( foundation models:自己教師あり学習や半教師あり学習により膨大なデータで学習した大規模人工知能モデル)は、ロボットのプランニングと視覚を支援するモデルをほぼ包含しており、運動と器用さもおそらく間もなく包含されるだろう。これは、さまざまな身体性( embodiments:ロボットの身体が持つ制約や、物理的な身体を持つことで認知機能に及ぼす影響)についても当てはまりつつある。最近、大規模な研究者コンソーシアムが、ある種類の機械から別の種類の機械にデータをうまく共有できることを示した。映画「トランスフォーマー( Transformers )」では、ヒューマノイドロボットの時もトラックに変身した時も、同じ 1 つの脳がオプティマス・プライム( Optimus Prime )を制御している。1 つの脳が産業用ロボットアームやドローン群、4 本足の貨物ロボットも制御できる日がまもなく来る。

 人間の脳は、制御できる機械に関しては可塑性がある。義肢を使ったことがなくても、レンチやテニスラケットが自分の体の延長のように感じられることがあるだろう。二重駐車されている車の横を通り過ぎれば、助手席側のミラーがぶつかりそうかどうか直感的にわかる。未来の AI が本物の脳のような運動可塑性( motor plasticity:特定の運動によって運動機能を担う神経細胞が繰り返し活動することで、同じパターンの脳活動が次にもっと起こりやすくなり、運動機能が回復すること)を獲得すると信じる理由は十分にある。「最終的に、私たちが目にするのは 1 つの知性のようなものである」と、Google DeepMind でロボット開発に携わっている研究員のキアタナ・ゴパラクリシュナン( Keerthana Gopalakrishnan )は言った。この目的のために、ヒューマノイドロボットのスタートアップ企業のフィギュアは、大規模言語モデルに物理的な形を与えるために OpenAI と提携した。OpenAI は数年に及ぶ休止期間を経てロボット研究に携わる研究者の採用を再開した。

 スタンフォード大学でロボット工学研究者で、ALOHA の初期開発に貢献したチェルシー・フィン( Chelsea Finn )は、Google に数年間勤務していた。しかし、彼女は少し前に同社を辞め、あらゆるロボットを制御できるソフトウェアの開発を目指すフィジカル・インテリジェンス( Physical Intelligence )というスタートアップ企業を共同設立した。ALOHA を私に見せてくれたドリエスも加わっている。1 カ月ほど前にフィジカル・インテリジェンスは初の「汎用ロボットポリシー( generalist robot policy ) 」を発表した。動画では、2 本アームのロボットが衣類乾燥機の中身をキャスター付き洗濯カゴに移し、洗濯カゴを押してテーブルまで移動させ、シャツやショーツを折りたたんで積み重ねている。「ロボットが洗濯カゴから 5 アイテムを続けて折りたたむのを初めて見た。それは私が研究結果に最も興奮した瞬間であった」とフィンは語った。この驚くべき実演をしたロボットを動かす AI は π₀ (パイゼロ)と呼ばれ、6 つの異なる実施形態を制御できると報告されており、1 つのポリシーで、食料品の袋詰め、箱の組み立て、食卓の片付けなど、 ALOHA では困難な複数のタスクを解決できる。世界についての幅広い知識を持ち、画像を理解できる ChatGPT のようなモデルと、模倣学習を組み合わせることで機能している。「これは間違いなく始まりに過ぎない」とフィンは言う。

 ロボットの未来を考える時、私たちは映画「宇宙家族ジェットソンズ( The Jetsons )」のお手伝いさんのロージー( Rosie )のように家事をするヒューマノイドを想像しがちである。しかし、ロボット革命はシャツをたたむ人型の機械が終着点ではない。私はニューヨーク市内に住んでいるが、目に見えるものはほとんどすべて人間の手によって作られたものである。セントラルパーク( Central Park )は人の手が加わっていないように見えるが、かつてはほとんど特徴のない沼地だった。何千人もの労働者が何年もかけて貯水池、湖、なだらかな丘陵を作り上げたのである。彼らの手がシャベルを地中に押し込んで丘を作った。導火線に火をつけて岩を吹き飛ばし、木々を土に植えた。

 数年前、スイスのチューリッヒ( Zurich )にある空港近くのリサイクルセンターで、1 つの超巨大な手が働いていた。チューリッヒ工科大学( ETH Zürich )の研究チームが開発した自律型エクスカベーター( excavator:パワーショベルとか掘削機などの重機のこと)である。擁壁を構築していた。アームの先端にある油圧グリッパ( hydraulic gripper )が丸石を 1 つ拾い上げ、まるで果物を眺めるかのように回転させた。エクスカベーターは、ソフトウェアで作成された計画に従って積み上げられる山 (将来の擁壁) に向かって進む。アルゴリズムが新しい丸石を石の山の上にどのように載せるべきかを考える。エクスカベーターは握っている力を緩め、石をちょうど良い位置に置き、また別の石を拾いに戻る。65 メートルの擁壁が完成した時、そこには 1,000 個近い巨石と再生コンクリートの破片が含まれていた。それは新しい公園の端となった。このロボットは、経験豊富な労働者がエクスカベーターを使うのと同じくらい素早く仕事をした。

 このプロジェクトの主任研究員ライアン・ルーク・ジョンズ( Ryan Luke Johns )は、「指を叩いて山を動かす( Tap your finger, move a mountain. ) 」をモットーとするグラビス・ロボティクス( Gravis Robotics )を経営している。彼は、材料の適応型再利用( adaptive reuse:本来の役割を終えた建物の再利用。アダプティブ・ユースとも言う)が普及してコンクリートを駆逐し、建設がより安価で魅力的になると予見している。ロボットが新しいセントラルパークを作るかもしれない。その魅力は容易に理解できるが、このような大きな力を持つものが世界に放たれるリスクを想像するのも容易である。既に私たちは、AI の制御が難しいことを認識している。安全上の理由からチャットボット( chatbots )は特定の種類のコンテンツ(誤情報、ポルノ、生物兵器の製造指示など)を生成することを制限されているが、素人が簡易なプロンプトで「ジェイルブレイク( jaikbreak )」する事例が日常茶飯事のように発生している。兵器について語る AI が危険だというなら、兵器となる AI を思い浮かべてほしい。ヒューマノイド戦士( humanoid soldier )、狙撃ドローン( sniper drone )、思考する爆弾( bomb that can think )などが考えられる。ロボットモデルが不可知論的実施形態( embodiment-agnostic )に依存しない、つまり操作対象物体の実際の動作に依存しないことが判明した場合、今日卓球で人間に勝っているのと同じ種類のポリシーが、いつか誰かを撃つことになるかもしれない。「多くのドローン製造業者が今、この問題に取り組んでいる」と、MIT の研究者の 1 人が私に語った。「彼らは『限定した者にしか販売しないし、武器を搭載したドローンは絶対に販売しない』と言うことはできる。だが、本当にそんなことが可能だろうか。悪意のある人物が介入したらどうなるだろうか…」。ウクライナ戦争では、空撮用に設計された民生用ドローンが遠隔操作の爆撃機と化している。このようなドローンが自律的に動くようになれば、各国空軍は自分たちが命令したのではない、ロボットが勝手に攻撃したのだと主張することができるようになる。「無生物を罰することはできない」と、英シェフィールド大学( the University of Sheffield )のコンピューターサイエンス名誉教授ノエル・シャーキー( Noel Sharkey )は言う。「戦争法上、責任の所在を明確にすることが不可欠である」。90 カ国以上が軍事ロボット開発を計画しており、そのほとんどはドローンの開発を進めていると推測されている。世界の主要軍事大国のいくつかは、こうしたロボットの使用を制限する可能性のある国連決議に同意していない。

 平和的なロボットも、人間の生活のリスクとなる可能性もある。私は、半自律型の家事専門ヒューマノイドロボットを開発している小さなスタートアップ企業の創業者に話を聞いた。そのロボットは、あなたが仕事に行くと、車輪を出してクローゼットから出てきて移動して片付けをし、何か問題が起きたら、インドかフィリピンにいるオペレーターに報告して引き継ぐ。このアプローチは、多くの時間とお金を節約することができる。一方で、多くの人から仕事を奪う可能性もある。そのような仕事をして生計を立てている家政婦等はどうなるのか、と私は創業者に尋ねた。創業者は、彼らは分配金の受け取りを申請できると答えた。「資本主義経済では、労働を資本に置き換え、人間を機械に置き換えようとするインセンティブが働いている」と、AI の倫理を専門とするウィーン大学( the University of Vienna )のマーク・コッケルベルグ( Mark Coeckelbergh )哲学教授は私に語った。彼は、「ロボット( Robot )」という言葉はチェコ語の「強制労働( forced labor ) 」を意味する” robota ”に由来していると指摘した。「すべてのタスクをロボットが引き継ぐべきではない。それは、私たちの手に委ねられている。これは、『人間はどんな仕事をすべきなのか』を考える一種の訓練である」。

 AI を搭載するロボットの未来について推測することは、19 世紀の帽子職人の視点から産業革命を想像しようとするようなものである。私たちは、物理的なノウハウが 1 つの身体の中に限定されていることに慣れすぎている。私が初めてペン回しを覚えたのは、ミシガン大学( the University of Michigan )のメイソン・ホール( Mason Hall )の空き教室だった。知り合いがやっているのを見て、見よう見まねで練習した。数時間かかった。他の人が同じトリックを習得したければ、彼らも練習しなければならない。しかし、ロボット研究者が物理的なノウハウを仮想平面( virtual plane )に取り込めれば、新しいスマートフォンアプリと同じくらい簡単に配布できるようになる。1 台のロボットが靴紐の結び方を覚えれば、すべてのロボットがそれをできるようになる。オムレツのレシピだけでなく、それを作る行為そのものをコピー&ペーストすることを想像してみてほしい。

 息子が生まれて間もない頃、血液検査で異常が見つかり、何度も採血をしなければならなかった。生後 8 週の子どもの細い腕から採血するのは容易ではない。ある日の採血はとてもお粗末だった。私と息子があまりに騒いだので、ある看護士が別の採血係に「マーシャ( Marsha )を呼んだ方が良いんじゃない?」と言った。直ぐにマーシャが来た。彼女はいとも簡単に静脈を見つけた。彼女の手には保険をかけるべきである。

 いつの日か、AI が金属製でありながら指先にジェルが入った手をカチカチ鳴らしながら新生児の腕から採血するようになるだろう。判断が難しいのだが、その日を祝うべきなのか、それとも恐れるべきなのか。おそらく、私がその日を迎えることはないだろう。しかし、息子は迎えるだろう。そんな考えが頭に思い浮かんだ。私は手を息子の小さな手に伸ばし、握った。♦

以上