KADOKAWA Technology Review
×
A 3-D World for Smarter AI Agents

ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開

グーグル・ディープマインドの新しいシミュレーション世界は、ロボット工学の進歩を導き、人間がどのように学ぶかに関する理解にも貢献するだろう。 by Will Knight2016.12.06

グーグル・ディープマインド(汎用的人工知能の実現に向けた根本的な進展を担うアルファベット(グーグル)の子会社)は、12月5日、他の研究者が実験し、思い通りに修正できる新しい三次元バーチャル世界を発表した。

新プラットフォーム「ディープマインドラボ」は、ブロックで構成された三次元の一人称シューティングゲームのような見た目だ。バーチャル世界内で人工知能(AI)エージェントは浮遊する球体として存在し、周囲の状況を認識し、動き回り、単純なアクションを実行できる。エージェントは、成功報酬を受け取る強化学習など、さまざまな機械学習の形態でタスクをこなせるように訓練できる。プラットフォームには、迷路を進んだり、果物を集めたり、細い通路を落下せずに横断するといった単純なタスクが用意されている。

ディープマインドのチーフサイエンティストであるシェーン・レッグ共同創業者は「弊社が開発中の人工知能エージェントは、周囲の状況を見たり、発生するイベントを観察したりして、さまざまなタスクを従来以上にうまく実行する方法を学べます」と、いう。

ディープマインドは従来、社内で「ラビリンス」と呼ばれた実験環境を使っていた(「”How Google Plans to Solve Artificial Intelligence“」参照)。ラビリンスは、試行錯誤により、多くのアタリ製ビデオゲームの遊び方を学ぶAIエージェントの開発で初めてメディアに大きく取りあげられた(参照“Google’s AI Masters Space Invaders”)。

オープンでカスタマイズ可能な三次元世界は、より複雑で視覚的要素が豊富な課題をエージェントに課し、与えられるタスクの範囲はとても広くなる。 ディープマインドラボは、あるタスクから次のタスクへと学習内容を移せるAIアルゴリズムを開発済みだ。

AIエージェントに三次元環境内のタスクをこなさせることは、産業用ロボットのような現実世界で働くシステムを制御するアルゴリズムの開発に役立つだろう、とレッグ共同創業者はいう。

さらに、シミュレーションされた世界を基本原則から学習するエージェントを作れば、人間がどう学ぶか(つまりレッグが大学の研究者として扱っていたテーマ)についても、重要なアイデアをもたらすだろう。レッグ共同創業者は「ロボットの学習と一般性問題(あることに当てはまることが別のことにも適用できること)に基本的な手法で挑むことは、私たちが子どもとして世界を学んだのと同じです」という。

他のAIの専門家は、ディープマインドラボのオープンを歓迎している。オープンAI(AIの基礎研究と社会還元を目指す非営利団体)のイリア・サツケバー共同創設者兼調査担当役員は「ディープマインドラボが多くの環境を公開しているのは非常によいことです」という。

「強化学習エージェントがより多くの環境に接するほど、この分野はより速く前進します」

英国ケンブリッジ大学のズビン・ガラマニ教授は、ディープマインドラボ等の強化学習用プラットフォームは、研究者が互いのアイデアを試すことで、進歩をより透明になる(得体の知れないAIが生まれる疑念が生まれにくくなる)という。

しかし、ガラマニ教授は、既存の強化学習手法は、必ずしも人間の能力には匹敵しないともいう。たとえば、一般的に、人間が特定のビデオゲームやボードゲームをマスターするのに要するプレー時間は、コンピューターよりはるかに少ない。

「強化学習の手法は、データ処理が不効率です。どうしたら人間に相当するペースでシステムが学習できるでしょうか?」

人気の記事ランキング
  1. This new image shows off magnetic fields swirling around a black hole 周囲の磁場くっきり、初撮影チームがブラックホール最新画像を公開
  2. What are the ingredients of Pfizer’s covid-19 vaccine? ファイザーの新型コロナワクチンの成分は?専門家が解説
  3. Error-riddled datasets are warping our sense of how good AI really is AIモデル評価用データセットに多数の誤り、実は優秀ではなかった?
  4. Google’s top security teams unilaterally shut down a counterterrorism operation グーグルが報告した手練れのハッキング集団、実は欧米の工作員
  5. Covid-19 immunity likely lasts for years 新型コロナ、免疫は長期間持続か=米新研究
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
Innovators Under 35 Japan 2020

MITテクノロジーレビューが主催するグローバル・アワード「Innovators Under 35」が2020年、日本に上陸する。特定の分野や業界だけでなく、世界全体にとって重要かつ独創的なイノベーターを発信していく取り組みを紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. This new image shows off magnetic fields swirling around a black hole 周囲の磁場くっきり、初撮影チームがブラックホール最新画像を公開
  2. What are the ingredients of Pfizer’s covid-19 vaccine? ファイザーの新型コロナワクチンの成分は?専門家が解説
  3. Error-riddled datasets are warping our sense of how good AI really is AIモデル評価用データセットに多数の誤り、実は優秀ではなかった?
  4. Google’s top security teams unilaterally shut down a counterterrorism operation グーグルが報告した手練れのハッキング集団、実は欧米の工作員
  5. Covid-19 immunity likely lasts for years 新型コロナ、免疫は長期間持続か=米新研究
MITテクノロジーレビュー[日本版] Vol.3/Spring 2021
MITテクノロジーレビュー[日本版] Vol.3/Spring 2021Innovation Issue

AI/ロボット工学、コンピューター/電子機器、輸送、ソフトウェア、インターネット分野で活躍する13人の日本発のイノベーターを紹介。併せて、グローバルで活躍する35人のイノベーターの紹介と、注目のイノベーション分野の動向解説も掲載しました。
日本と世界のイノベーションの最新情報がまとめて読める1冊です。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る