
ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
-
- How to run an LLM on your laptop チャットGPTからの卒業:自分のパソコンでLLMを動かしてみよう
- Promotion MITTR Emerging Technology Nite #34 【9/10開催】伝説の玩具「アームトロン」開発者が誕生秘話を語る
- On the ground in Ukraine’s largest Starlink repair shop <現地ルポ>ウクライナの 生命線「スターリンク」 1万台超を直した非公式工場
- Why recycling isn’t enough to address the plastic problem リサイクルだけでは「プラスチック問題」を解決できない理由
- In a first, Google has released data on how much energy an AI prompt uses 1クエリでレンジ1秒分、グーグルがGeminiの消費電力を初公開