KADOKAWA Technology Review
×
A 3-D World for Smarter AI Agents

ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開

グーグル・ディープマインドの新しいシミュレーション世界は、ロボット工学の進歩を導き、人間がどのように学ぶかに関する理解にも貢献するだろう。 by Will Knight2016.12.06

グーグル・ディープマインド(汎用的人工知能の実現に向けた根本的な進展を担うアルファベット(グーグル)の子会社)は、12月5日、他の研究者が実験し、思い通りに修正できる新しい三次元バーチャル世界を発表した。

新プラットフォーム「ディープマインドラボ」は、ブロックで構成された三次元の一人称シューティングゲームのような見た目だ。バーチャル世界内で人工知能(AI)エージェントは浮遊する球体として存在し、周囲の状況を認識し、動き回り、単純なアクションを実行できる。エージェントは、成功報酬を受け取る強化学習など、さまざまな機械学習の形態でタスクをこなせるように訓練できる。プラットフォームには、迷路を進んだり、果物を集めたり、細い通路を落下せずに横断するといった単純なタスクが用意されている。

ディープマインドのチーフサイエンティストであるシェーン・レッグ共同創業者は「弊社が開発中の人工知能エージェントは、周囲の状況を見たり、発生するイベントを観察したりして、さまざまなタスクを従来以上にうまく実行する方法を学べます」と、いう。

ディープマインドは従来、社内で「ラビリンス」と呼ばれた実験環境を使っていた(「”How Google Plans to Solve Artificial Intelligence“」参照)。ラビリンスは、試行錯誤により、多くのアタリ製ビデオゲームの遊び方を学ぶAIエージェントの開発で初めてメディアに大きく取りあげられた(参照“Google’s AI Masters Space Invaders”)。

オープンでカスタマイズ可能な三次元世界は、より複雑で視覚的要素が豊富な課題をエージェントに課し、与えられるタスクの範囲はとても広くなる。 ディープマインドラボは、あるタスクから次のタスクへと学習内容を移せるAIアルゴリズムを開発済みだ。

AIエージェントに三次元環境内のタスクをこなさせることは、産業用ロボットのような現実世界で働くシステムを制御するアルゴリズムの開発に役立つだろう、とレッグ共同創業者はいう。

さらに、シミュレーションされた世界を基本原則から学習するエージェントを作れば、人間がどう学ぶか(つまりレッグが大学の研究者として扱っていたテーマ)についても、重要なアイデアをもたらすだろう。レッグ共同創業者は「ロボットの学習と一般性問題(あることに当てはまることが別のことにも適用できること)に基本的な手法で挑むことは、私たちが子どもとして世界を学んだのと同じです」という。

他のAIの専門家は、ディープマインドラボのオープンを歓迎している。オープンAI(AIの基礎研究と社会還元を目指す非営利団体)のイリア・サツケバー共同創設者兼調査担当役員は「ディープマインドラボが多くの環境を公開しているのは非常によいことです」という。

「強化学習エージェントがより多くの環境に接するほど、この分野はより速く前進します」

英国ケンブリッジ大学のズビン・ガラマニ教授は、ディープマインドラボ等の強化学習用プラットフォームは、研究者が互いのアイデアを試すことで、進歩をより透明になる(得体の知れないAIが生まれる疑念が生まれにくくなる)という。

しかし、ガラマニ教授は、既存の強化学習手法は、必ずしも人間の能力には匹敵しないともいう。たとえば、一般的に、人間が特定のビデオゲームやボードゲームをマスターするのに要するプレー時間は、コンピューターよりはるかに少ない。

「強化学習の手法は、データ処理が不効率です。どうしたら人間に相当するペースでシステムが学習できるでしょうか?」

人気の記事ランキング
  1. Singapore’s police now have access to contact tracing data シンガポールの接触追跡アプリが方針転換、犯罪捜査でも利用可に
  2. The winners of Innovators under 35 Japan 2020 have been announced MITTRが選ぶ、日本発の35歳未満のイノベーターを発表
  3. Don’t panic about the latest coronavirus mutations, say drug companies 新型コロナ「変異種」を過度に恐れる必要がないこれだけの理由
  4. Don’t worry, the earth is doomed 人類を滅亡に導く、15の破壊的リスク
  5. The kitchen of the future is here, it’s just not evenly distributed 電子レンジ、真空調理器超える「キッチン・テクノロジー」の未来
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
Innovators Under 35 Japan 2020

MITテクノロジーレビューが主催するグローバル・アワード「Innovators Under 35」が2020年、日本に上陸する。特定の分野や業界だけでなく、世界全体にとって重要かつ独創的なイノベーターを発信していく取り組みを紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Singapore’s police now have access to contact tracing data シンガポールの接触追跡アプリが方針転換、犯罪捜査でも利用可に
  2. The winners of Innovators under 35 Japan 2020 have been announced MITTRが選ぶ、日本発の35歳未満のイノベーターを発表
  3. Don’t panic about the latest coronavirus mutations, say drug companies 新型コロナ「変異種」を過度に恐れる必要がないこれだけの理由
  4. Don’t worry, the earth is doomed 人類を滅亡に導く、15の破壊的リスク
  5. The kitchen of the future is here, it’s just not evenly distributed 電子レンジ、真空調理器超える「キッチン・テクノロジー」の未来
MITテクノロジーレビュー[日本版] Vol.2/Winter 2020
MITテクノロジーレビュー[日本版] Vol.2/Winter 2020SDGs Issue

今、世界中の企業や機関の技術者・研究者たちが各地で抱える社会課題を解決し、持続可能な世界の実現へ向けて取り組んでいる「SDGs(持続可能な開発目標)」。
気候変動や貧困といった地球規模の課題の解決策としての先端テクノロジーに焦点を当て、解決に挑む人々の活動や、日本企業がSDGsを経営にどう取り入れ、取り組むべきか、日本が国際社会から期待される役割について、専門家の提言を紹介します。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る