KADOKAWA Technology Review
×
【新規購読者限定】ひと月あたり1000円で始められるキャンペーン実施中!
A 3-D World for Smarter AI Agents

ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開

グーグル・ディープマインドの新しいシミュレーション世界は、ロボット工学の進歩を導き、人間がどのように学ぶかに関する理解にも貢献するだろう。 by Will Knight2016.12.06

グーグル・ディープマインド(汎用的人工知能の実現に向けた根本的な進展を担うアルファベット(グーグル)の子会社)は、12月5日、他の研究者が実験し、思い通りに修正できる新しい三次元バーチャル世界を発表した。

新プラットフォーム「ディープマインドラボ」は、ブロックで構成された三次元の一人称シューティングゲームのような見た目だ。バーチャル世界内で人工知能(AI)エージェントは浮遊する球体として存在し、周囲の状況を認識し、動き回り、単純なアクションを実行できる。エージェントは、成功報酬を受け取る強化学習など、さまざまな機械学習の形態でタスクをこなせるように訓練できる。プラットフォームには、迷路を進んだり、果物を集めたり、細い通路を落下せずに横断するといった単純なタスクが用意されている。

ディープマインドのチーフサイエンティストであるシェーン・レッグ共同創業者は「弊社が開発中の人工知能エージェントは、周囲の状況を見たり、発生するイベントを観察したりして、さまざまなタスクを従来以上にうまく実行する方法を学べます」と、いう。

ディープマインドは従来、社内で「ラビリンス」と呼ばれた実験環境を使っていた(「”How Google Plans to Solve Artificial Intelligence“」参照)。ラビリンスは、試行錯誤により、多くのアタリ製ビデオゲームの遊び方を学ぶAIエージェントの開発で初めてメディアに大きく取りあげられた(参照“Google’s AI Masters Space Invaders”)。

オープンでカスタマイズ可能な三次元世界は、より複雑で視覚的要素が豊富な課題をエージェントに課し、与えられるタスクの範囲はとても広くなる。 ディープマインドラボは、あるタスクから次のタスクへと学習内容を移せるAIアルゴリズムを開発済みだ。

AIエージェントに三次元環境内のタスクをこなさせることは、産業用ロボットのような現実世界で働くシステムを制御するアルゴリズムの開発に役立つだろう、とレッグ共同創業者はいう。

さらに、シミュレーションされた世界を基本原則から学習するエージェントを作れば、人間がどう学ぶか(つまりレッグが大学の研究者として扱っていたテーマ)についても、重要なアイデアをもたらすだろう。レッグ共同創業者は「ロボットの学習と一般性問題(あることに当てはまることが別のことにも適用できること)に基本的な手法で挑むことは、私たちが子どもとして世界を学んだのと同じです」という。

他のAIの専門家は、ディープマインドラボのオープンを歓迎している。オープンAI(AIの基礎研究と社会還元を目指す非営利団体)のイリア・サツケバー共同創設者兼調査担当役員は「ディープマインドラボが多くの環境を公開しているのは非常によいことです」という。

「強化学習エージェントがより多くの環境に接するほど、この分野はより速く前進します」

英国ケンブリッジ大学のズビン・ガラマニ教授は、ディープマインドラボ等の強化学習用プラットフォームは、研究者が互いのアイデアを試すことで、進歩をより透明になる(得体の知れないAIが生まれる疑念が生まれにくくなる)という。

しかし、ガラマニ教授は、既存の強化学習手法は、必ずしも人間の能力には匹敵しないともいう。たとえば、一般的に、人間が特定のビデオゲームやボードゲームをマスターするのに要するプレー時間は、コンピューターよりはるかに少ない。

「強化学習の手法は、データ処理が不効率です。どうしたら人間に相当するペースでシステムが学習できるでしょうか?」

人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
MITテクノロジーレビュー[日本版] Vol.7
MITテクノロジーレビュー[日本版] Vol.7世界を変える10大技術 2022年版

パンデミック収束の切り札として期待される「新型コロナウイルス感染症(COVID-19)飲み薬」、アルファ碁の開発企業が作った「タンパク質構造予測AI」、究極のエネルギー技術として期待が高まる「実用的な核融合炉」など、2022年に最も注目すべきテクノロジー・トレンドを一挙解説。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る