KADOKAWA Technology Review
×
A 3-D World for Smarter AI Agents

ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開

グーグル・ディープマインドの新しいシミュレーション世界は、ロボット工学の進歩を導き、人間がどのように学ぶかに関する理解にも貢献するだろう。 by Will Knight2016.12.06

グーグル・ディープマインド(汎用的人工知能の実現に向けた根本的な進展を担うアルファベット(グーグル)の子会社)は、12月5日、他の研究者が実験し、思い通りに修正できる新しい三次元バーチャル世界を発表した。

新プラットフォーム「ディープマインドラボ」は、ブロックで構成された三次元の一人称シューティングゲームのような見た目だ。バーチャル世界内で人工知能(AI)エージェントは浮遊する球体として存在し、周囲の状況を認識し、動き回り、単純なアクションを実行できる。エージェントは、成功報酬を受け取る強化学習など、さまざまな機械学習の形態でタスクをこなせるように訓練できる。プラットフォームには、迷路を進んだり、果物を集めたり、細い通路を落下せずに横断するといった単純なタスクが用意されている。

ディープマインドのチーフサイエンティストであるシェーン・レッグ共同創業者は「弊社が開発中の人工知能エージェントは、周囲の状況を見たり、発生するイベントを観察したりして、さまざまなタスクを従来以上にうまく実行する方法を学べます」と、いう。

ディープマインドは従来、社内で「ラビリンス」と呼ばれた実験環境を使っていた(「”How Google Plans to Solve Artificial Intelligence“」参照)。ラビリンスは、試行錯誤により、多くのアタリ製ビデオゲームの遊び方を学ぶAIエージェントの開発で初めてメディアに大きく取りあげられた(参照“Google’s AI Masters Space Invaders”)。

オープンでカスタマイズ可能な三次元世界は、より複雑で視覚的要素が豊富な課題をエージェントに課し、与えられるタスクの範囲はとても広くなる。 ディープマインドラボは、あるタスクから次のタスクへと学習内容を移せるAIアルゴリズムを開発済みだ。

AIエージェントに三次元環境内のタスクをこなさせることは、産業用ロボットのような現実世界で働くシステムを制御するアルゴリズムの開発に役立つだろう、とレッグ共同創業者はいう。

さらに、シミュレーションされた世界を基本原則から学習するエージェントを作れば、人間がどう学ぶか(つまりレッグが大学の研究者として扱っていたテーマ)についても、重要なアイデアをもたらすだろう。レッグ共同創業者は「ロボットの学習と一般性問題(あることに当てはまることが別のことにも適用できること)に基本的な手法で挑むことは、私たちが子どもとして世界を学んだのと同じです」という。

他のAIの専門家は、ディープマインドラボのオープンを歓迎している。オープンAI(AIの基礎研究と社会還元を目指す非営利団体)のイリア・サツケバー共同創設者兼調査担当役員は「ディープマインドラボが多くの環境を公開しているのは非常によいことです」という。

「強化学習エージェントがより多くの環境に接するほど、この分野はより速く前進します」

英国ケンブリッジ大学のズビン・ガラマニ教授は、ディープマインドラボ等の強化学習用プラットフォームは、研究者が互いのアイデアを試すことで、進歩をより透明になる(得体の知れないAIが生まれる疑念が生まれにくくなる)という。

しかし、ガラマニ教授は、既存の強化学習手法は、必ずしも人間の能力には匹敵しないともいう。たとえば、一般的に、人間が特定のビデオゲームやボードゲームをマスターするのに要するプレー時間は、コンピューターよりはるかに少ない。

「強化学習の手法は、データ処理が不効率です。どうしたら人間に相当するペースでシステムが学習できるでしょうか?」

人気の記事ランキング
  1. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
  2. How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
  3. Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
  2. How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
  3. Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る