KADOKAWA Technology Review
×
ディープマインド、未知のゲームもプレイできるAIエージェント
COFFEE STAIN STUDIOS
An AI that can play Goat Simulator is a step towards more useful AI

ディープマインド、未知のゲームもプレイできるAIエージェント

グーグル・ディープマインドの新しいAIエージェントは、人間のプレイヤーを観察することで、これまで見たことのないさまざまなゲームをプレイできる。 by Melissa Heikkilä2024.03.15

ヤギよ、もっと飛べ! グーグル・ディープマインド (Google Deepmind)の新しい人工知能(AI)エージェントは、大げさな物理的挙動が特徴の楽しいアクション・ゲーム「ゴートシミュレーター3(Goat Simulator)」など、AIが初めてプレイするゲームを含むさまざまなゲームをプレイできる。研究者はテキスト・コマンドを使ってAIに指示を出し、7つの異なるゲームをプレイさせ、3つの異なる3D研究環境で動き回らせることに成功した。これは複数の環境間でスキルを伝達できる、より汎用化されたAIへの一歩である。

グーグル・ディープマインドは、ゲームプレイAIシステムの開発で大きな成功を収めてきた。2016年に、囲碁のトッププロ棋士の李 世乭(リ・セドル)を破った「アルファ碁(AlphaGo)」は、深層学習の力を示す大きなマイルストーンとなった。1つのゲームだけをマスターしたり、単一の目標やコマンドにしか従うことができなかった以前のゲームプレイAIシステムとは異なり、この新しいAIエージェントは、「ヴァルヘイム(Valheim)」や「ノーマンズスカイ(No Man’s Sky)」など、さまざまなゲームをプレイすることが可能だ。

ゲーム内でAIシステムを訓練することは、現実世界のタスクの優れた代替手段となる。スタンフォード大学のマイケル・バーンスタイン准教授(コンピューター科学)は、「一般的なゲームをプレイをするAIエージェントは、原理的には単一の環境で何かをするよりも、我々の世界をナビゲートする方法についてより多くのことを学べるのです」と話す。

「いつの日か、超人的なエージェントと対戦するのではなく、SIMAのようなエージェントがあなたやあなたの友人と一緒に、ゲームをプレイする日が来るかもしれません」。SIMA(スケーラブル、インストラクタブル、マルチワールド・エージェント)と呼ばれるこのエージェントを開発したチームの一員である、グーグル・ディープマインドの研究エンジニア、ティム・ハーレーは言う。

グーグル・ディープマインドの研究エンジニアであるフレデリック・ベッセによると、同チームは、キーボードやマウスの入力、ゲーム内でのプレイヤーの行動に関する注釈とともに、人間が個人または共同でビデオゲームをプレイする多くの例に基づいてSIMAを訓練したという。

研究チームは模倣学習と呼ばれるAI技術を使い、人間と同じようにゲームをプレイするようにAIエージェントに教えた。SIMAは「左に曲がれ」「はしごを登れ」「マップを開け」といった600の基本的な指示に従うことができ、それらを約10秒以内に完了できる。

研究チームはまた、多くのゲームで訓練を受けたSIMAエージェントの方が、1つのゲームだけをプレイする方法を学んだAIエージェントよりも優れていることを発見した。これは、ゲーム間の共通概念を利用して、より優れたスキルを学習し、指示を実行する能力が向上したためだとベッセは述べている。

「これは本質的に、まだ見たことのないゲームをプレイできるAIエージェントを手に入れたという点で、非常に刺激的かつ重要なことなのです」

ロンドンのクイーン・メアリー大学のパウロ・ラウバー講師は、この種のゲーム間での知識の伝達を見ることは、AI研究にとって重要なマイルストーンだと語る。

人間が提供した例に基づいて命令の実行方法を学習するという基本的な考え方は、将来、特に大規模なデータセットを使用する場合に、より強力なシステムにつながる可能性があるとラウバー講師は言う。そしてSIMAのデータセットが比較的限られていることが、そのパフォーマンスを妨げていると指摘する。

訓練対象のゲーム環境の数はまだ少ないものの、SIMAはスケールアップに向けて正しい軌道に乗っていると、エヌビディア(Nvidia)でAIエージェント・イニシアチブ(AI Agents Initiative)を運営するジム・ファン上級研究科学者は述べている。

ただ、AIシステムはまだ人間のレベルには程遠い、とグーグル・ディープマインドのハーレーは言う。たとえば、「ノーマンズスカイ」では、AIエージェントは人間が実行できるタスクの60%しか実行できなかった。そして研究チームが、人間がSIMAに指示を与える機能を削除したところ、エージェントのパフォーマンスが以前よりも大幅に低下してしまった。

次に、ベッセはチームはエージェントのパフォーマンスの向上に取り組んでいると述べた。研究チームは、AIシステムをできるだけ多くの環境で動作させて新しいスキルを学習させ、ユーザーがチャットをしてAIエージェントから応答を得られるようにしたいと考えている。チームはまた、SIMAがより汎用化されたスキルを身につけ、人間と同じように、まだ見たことのないゲームをすぐに覚えられるようにしたいと考えている。

人間は、「初めての環境や状況に対して非常にうまく一般化することができます。そして、私たちはAIエージェントにもそうあることを望んでいるのです」とベッセは語った。

SIMAは、自律エージェントのための「チャットGPTの瞬間」に私たちを少しずつ近づけてくれると、カリフォルニア大学アーバイン校のロイ・フォックス助教授は話す。

ただし、SIMAは実際の自律型AIにはほど遠いものだ。自律型AIは「まったくの別物」になるとフォックス助教授は述べた。

人気の記事ランキング
  1. Inside the tedious effort to tally AI’s energy appetite 動画生成は別次元、思ったより深刻だったAIの電力問題
  2. Promotion Call for entries for Innovators Under 35 Japan 2025 「Innovators Under 35 Japan」2025年度候補者募集のお知らせ
  3. IBM aims to build the world’s first large-scale, error-corrected quantum computer by 2028 IBM、世界初の大規模誤り訂正量子コンピューター 28年実現へ
  4. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
メリッサ・ヘイッキラ [Melissa Heikkilä]米国版 AI担当上級記者
MITテクノロジーレビューの上級記者として、人工知能とそれがどのように社会を変えていくかを取材している。MITテクノロジーレビュー入社以前は『ポリティコ(POLITICO)』でAI政策や政治関連の記事を執筆していた。英エコノミスト誌での勤務、ニュースキャスターとしての経験も持つ。2020年にフォーブス誌の「30 Under 30」(欧州メディア部門)に選出された。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る