KADOKAWA Technology Review
×
Minecraft Is a Testing Ground for Human-AI Collaboration

人間とは何か?
人工知能がマイクラで学習中

マイクロソフトは、マインクラフトの実験バージョンを人工知能のオリンピックにした。 by Will Knight2016.07.21

ブロック状でどこかまぬけなコンピューター・ゲーム「マインクラフト」(2014年にマイクロソフトが買収したインディーズ・ゲーム)は、人間と人工知能(AI)がどう協力するかを学ぶ素晴らしい場になるかもしれない。

マイクロソフトの研究者が今月発表したマインクラフトの実験的新バージョンでは、AIを訓練して、橋を渡ったり、複雑な物体を作り上げたりと、あらゆるタスクをこなせる。新プラットフォーム「プロジェクト・マルモ」では、通常は人間のプレイヤーが操作するマインクラフトのキャラクターを、学習アルゴリズムが操作できるようになった。しかも、人間のプレイヤーとAIエージェントが協力したり、チャット・ウィンドウで人間が出来たてのAIと会話したりできる。

「長期的には、どのユーザーからも学んで、その人たちがしたいことを助けるAIを目指しています」というのはマイクロソフトリサーチ・ケンブリッジでプロジェクトを指揮したカーチャ・ホフマン研究員。

ニューヨークの学会で先週、人工知能研究者にプロジェクト・マルモをデモンストレーションしたホフマン研究員は、人間とA間の共同作業こそがプロジェクトの重要目標だという。

「私たちは、協力的なAIの開発に取り組む研究者に必要なあらゆる機能をこのソフトウェアに組み込みました」

プロジェクト・マルモの狙いは、強化学習アルゴリズム(望ましい行動をとったとき、疑似的に報酬を与えてコンピュータを学習する方法)の検証だ。たとえば、マインクラフトのキャラクターを操作するAIが、障害物でいっぱいの部屋の中を通り抜けるよう学習させ、部屋の向こう側にたどりついたら報酬を与える。人間のマインクラフト・プレイヤーも、AIに助言することで学習過程に参加するようになれば、AIはやがて指示内容からも学習するだろう。

A character in Minecraft controlled by an algorithm and another operated by a person.
マインクラフトで、人が操作するキャラクター(左)とアルゴリズムが操作するキャラクター(右)

機械学習アルゴリズムはますます賢くなっており、人間をより生産的で効率的にする可能性がある。この考えは、マイクロソフトのサティア・ナデラCEOが、マイクロソフトにとって特に重要だと強調してきた。しかしこれまで、人間とAIの協力を重点的に研究することは比較的少なかった。

ホフマン研究員は、この研究は、最終的には通常のゲームにも影響を与えると信じている。

「将来、人間がAIエージェントを訓練し、退屈な作業を任せることになるでしょう」

ホフマン研究員によれば、マインクラフト・プレイヤーを補助するAIの開発は、日常生活で人間の能力を補なうコンピューター・ソフトウェアへの第一歩だ。

「確実に便利で、人間の能力を高めてくれるAIを私たちが本当に開発すべきです」

人工知能の研究者は、最新の機械学習の手法を試す場として、コンピューター・ゲームに頼るようになった。昨年の初めには、グーグルのディープマインドがアタリのさまざまな2Dゲームを神業レベルでプレーできるようになるアルゴリズムをデモンストレーションして注目を浴びた。使われたのは、深層学習(入力データに反応するように訓練された、非常に大きなニューラール・ネットワーク)と強化学習を連携させたアルゴリズムだ。以降、グーグルの研究者はより複雑な3Dゲーム世界でも迷わずに行動する学習アルゴリズムの映像を公開したが、研究の詳細は明かされていない。

マインクラフトはグラフィックスが単純で明確なゴールが一切ないのに大人気だ。マインクラフトのファンは、その中で驚くほど複雑な構造物や機械を数多く作り上げている(”The Secret to a Video-Game Phenomenon“参照)。また、マインクラフトは比較的単純ではあるが、ロボット・アルゴリズムの実験場として最適かもしれない。(”Minecraft Shows Robots How to Stop Dithering“参照)。

マインクラフトを実際にアルゴリズムの実験に使っているブラウン大学のステファニー・テレックス教授は、プロジェクト・マルモは、研究者が自分の手法を他の研究者と比較検討しやすく、とても価値があるという。「マインクラフトを人工知能のオリンピックのように利用するのは素晴らしい考えだと思います」という。また、たとえば人間と人工知能のコミュニケーションに関するデータは、現代の機械学習には欠かせず、大量のデータを集めるのプラットフォームとしても有効だともいう。

マルモの対象は、人工知能や機械学習、ロボット工学に取り組む人々だが、十分な技術的能力を持つ人なら誰でもダウンロードしてゲーム内のAIを試せる。ソフトウェアには機械学習パッケージとサンプルAIをいくつか含んでおり、実際、マニアや人工知能が専門ではないソフトウェア・エンジニアもダウンロードした。

人気の記事ランキング
  1. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
  2. How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
  3. Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
  2. How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
  3. Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る