ディープマインド、人間よりチームワークに優れたAIを開発
アルファベット(グーグル)の人工知能(AI)子会社であるディープマインドは、単純なテレビゲームで複数のAIプログラムが協力する方法を効率よく学習させる手法を開発した。最も驚くべき点は、AIプログラムが人間のプレイヤーとも協力できることである。AIプログラムと協力したプレイヤーたちは口々に、AIプログラムの方がほとんどの人間よりも良いチームメイトだという。
ディープマインドの研究者たちは、AIプログラムにファーストパーソン・シューティングゲーム(FPS:一人称視点のシューティングゲーム)である「クウェイク III アリーナ(Quake III Arena)」の修正版を用いて、相手の旗をつかみとるゲームをプレイするように訓練した。AIプログラムにチームワークを効率よく身につけさせるのは非常に難しい。というのは、チームワークでは複雑かつ常に変わる状況を扱わねばならないからだ 。
研究者たちは「勝利のために(For the Win)」とニックネームをつけたアルゴリズムを用いた。このアルゴリズムは、動物の学習方法をモデルにした機械学習手法である強化学習を用いて、多数のAIプログラムを同時に訓練する。「勝利のために」では、いくつかの工夫を施して、強化学習の過程を最適化し、微調整した。
今回の成果は期待が持てる進歩だ。なぜなら今後、複数のAIプログラムが互いにうまく協力する必要性が出てくるであろうからだ。しかし、今回のAIプログラムが非常に単純な世界で動作していることには留意する必要がある。実世界でチームワークを発揮するのはそれよりはるかに難しく、チームワークを達成するにはかなり時間がかかりそうだ。
オープンAIが「年齢予測」導入、子ども保護の責任誰が負う?
特別編集版『ポスト都市時代の社会デザイン 社会実装都市 ひろしま』発行のお知らせ
eムック 『新・陰謀論の時代 社会を蝕む「信念」の正体』特集号
期待外れのCRISPR治療、包括的承認で普及目指す新興企業
書評:サム・アルトマンはいかにして「AI帝国」を築いたか