ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
- Singapore’s police now have access to contact tracing data シンガポールの接触追跡アプリが方針転換、犯罪捜査でも利用可に
- The winners of Innovators under 35 Japan 2020 have been announced MITTRが選ぶ、日本発の35歳未満のイノベーターを発表
- Don’t panic about the latest coronavirus mutations, say drug companies 新型コロナ「変異種」を過度に恐れる必要がないこれだけの理由
- Don’t worry, the earth is doomed 人類を滅亡に導く、15の破壊的リスク
- The kitchen of the future is here, it’s just not evenly distributed 電子レンジ、真空調理器超える「キッチン・テクノロジー」の未来