
ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
-
- Inside the tedious effort to tally AI’s energy appetite 動画生成は別次元、思ったより深刻だったAIの電力問題
- Promotion Call for entries for Innovators Under 35 Japan 2025 「Innovators Under 35 Japan」2025年度候補者募集のお知らせ
- What’s next for AI and math 数学オリンピックで「人間超え」のAIは数学者になれるか?
- IBM aims to build the world’s first large-scale, error-corrected quantum computer by 2028 IBM、世界初の大規模誤り訂正量子コンピューター 28年実現へ
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法