ディープマインド、人間よりチームワークに優れたAIを開発

アルファベット（グーグル）の人工知能（AI）子会社であるディープマインドは、単純なテレビゲームで複数のAIプログラムが協力する方法を効率よく学習させる手法を開発した。最も驚くべき点は、AIプログラムが人間のプレイヤーとも協力できることである。AIプログラムと協力したプレイヤーたちは口々に、AIプログラムの方がほとんどの人間よりも良いチームメイトだという。

ディープマインドの研究者たちは、AIプログラムにファーストパーソン・シューティングゲーム（FPS：一人称視点のシューティングゲーム）である「クウェイク III アリーナ（Quake III Arena）」の修正版を用いて、相手の旗をつかみとるゲームをプレイするように訓練した。AIプログラムにチームワークを効率よく身につけさせるのは非常に難しい。というのは、チームワークでは複雑かつ常に変わる状況を扱わねばならないからだ。

研究者たちは「勝利のために（For the Win）」とニックネームをつけたアルゴリズムを用いた。このアルゴリズムは、動物の学習方法をモデルにした機械学習手法である強化学習を用いて、多数のAIプログラムを同時に訓練する。「勝利のために」では、いくつかの工夫を施して、強化学習の過程を最適化し、微調整した。

今回の成果は期待が持てる進歩だ。なぜなら今後、複数のAIプログラムが互いにうまく協力する必要性が出てくるであろうからだ。しかし、今回のAIプログラムが非常に単純な世界で動作していることには留意する必要がある。実世界でチームワークを発揮するのはそれよりはるかに難しく、チームワークを達成するにはかなり時間がかかりそうだ。

DeepMind’s AI agents are better than humans at being your teammate ディープマインド、人間よりチームワークに優れたAIを開発