ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
- Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
- How thermal batteries are heating up energy storage レンガにエネルギーを蓄える「熱電池」に熱視線が注がれる理由
- Researchers taught robots to run. Now they’re teaching them to walk 走るから歩くへ、強化学習AIで地道に進化する人型ロボット
- This US startup makes a crucial chip material and is taking on a Japanese giant 知られざる半導体材料の巨人 「味の素」の牙城を狙う 米スタートアップの勝算