KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
A 3-D World for Smarter AI Agents

ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開

グーグル・ディープマインドの新しいシミュレーション世界は、ロボット工学の進歩を導き、人間がどのように学ぶかに関する理解にも貢献するだろう。 by Will Knight2016.12.06

グーグル・ディープマインド(汎用的人工知能の実現に向けた根本的な進展を担うアルファベット(グーグル)の子会社)は、12月5日、他の研究者が実験し、思い通りに修正できる新しい三次元バーチャル世界を発表した。

新プラットフォーム「ディープマインドラボ」は、ブロックで構成された三次元の一人称シューティングゲームのような見た目だ。バーチャル世界内で人工知能(AI)エージェントは浮遊する球体として存在し、周囲の状況を認識し、動き回り、単純なアクションを実行できる。エージェントは、成功報酬を受け取る強化学習など、さまざまな機械学習の形態でタスクをこなせるように訓練できる。プラットフォームには、迷路を進んだり、果物を集めたり、細い通路を落下せずに横断するといった単純なタスクが用意されている。

ディープマインドのチーフサイエンティストであるシェーン・レッグ共同創業者は「弊社が開発中の人工知能エージェントは、周囲の状況を見たり、発生するイベントを観察したりして、さまざまなタスクを従来以上にうまく実行する方法を学べます」と、いう。

ディープマインドは従来、社内で「ラビリンス」と呼ばれた実験環境を使っていた(「”How Google Plans to Solve Artificial Intelligence“」参照)。ラビリンスは、試行錯誤により、多くのアタリ製ビデオゲームの遊び方を学ぶAIエージェントの開発で初めてメディアに大きく取りあげられた(参照“Google’s AI Masters Space Invaders”)。

オープンでカスタマイズ可能な三次元世界は、より複雑で視覚的要素が豊富な課題をエージェントに課し、与えられるタスクの範囲はとても広くなる。 ディープマインドラボは、あるタスクから次のタスクへと学習内容を移せるAIアルゴリズムを開発済みだ。

AIエージェントに三次元環境内のタスクをこなさせることは、産業用ロボットのような現実世界で働くシステムを制御するアルゴリズムの開発に役立つだろう、とレッグ共同創業者はいう。

さらに、シミュレーションされた世界を基本原則から学習するエージェントを作れば、人間がどう学ぶか(つまりレッグが大学の研究者として扱っていたテーマ)についても、重要なアイデアをもたらすだろう。レッグ共同創業者は「ロボットの学習と一般性問題(あることに当てはまることが別のことにも適用できること)に基本的な手法で挑むことは、私たちが子どもとして世界を学んだのと同じです」という。

他のAIの専門家は、ディープマインドラボのオープンを歓迎している。オープンAI(AIの基礎研究と社会還元を目指す非営利団体)のイリア・サツケバー共同創設者兼調査担当役員は「ディープマインドラボが多くの環境を公開しているのは非常によいことです」という。

「強化学習エージェントがより多くの環境に接するほど、この分野はより速く前進します」

英国ケンブリッジ大学のズビン・ガラマニ教授は、ディープマインドラボ等の強化学習用プラットフォームは、研究者が互いのアイデアを試すことで、進歩をより透明になる(得体の知れないAIが生まれる疑念が生まれにくくなる)という。

しかし、ガラマニ教授は、既存の強化学習手法は、必ずしも人間の能力には匹敵しないともいう。たとえば、一般的に、人間が特定のビデオゲームやボードゲームをマスターするのに要するプレー時間は、コンピューターよりはるかに少ない。

「強化学習の手法は、データ処理が不効率です。どうしたら人間に相当するペースでシステムが学習できるでしょうか?」

人気の記事ランキング
  1. A new US phone network for Christians aims to block porn and gender-related content ポルノもLGBTも遮断、キリスト教徒向けMVNOが米国で登場
  2. Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models 「オープンAIを蒸留した」マスク対アルトマン第1週、法廷がざわめく
  3. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る