![](https://www.technologyreview.jp/wp-content/themes/technologyreview/img/dummy.png)
John Schulman ジョン・シュルマン (30)
AIエージェントが訓練で得た知識を新しい状況に適応できるように、自ら試行錯誤するという重要なアルゴリズムを開発している。
オープンAI(OpenAI)の研究科学者ジョン・シュルマンは、「強化学習」と呼ばれる機械学習の分野で、重要なアルゴリズムをいくつか開発した。その名の通り、強化学習は正しい反応に対して褒美を与えることで、犬を訓練するのと同じように人工知能(AI)エージェントを訓練する。機械にとっての「褒美」は、たとえばビデオゲームで高得点を獲得するといったことだ。
1991年に登場したビデオ・ゲーム「ソニック・ザ・ヘッジホッグ(Sonic the Hedgehog)」についてシュルマンが熱心に語るのは、それが理由だ。シュルマンによると、このゲームは、新しい機械学習アルゴリズムが学習したスキルを新しい状況にいかにうまく適用するかを測るのに理想的なベンチマークになるという。ソニックは世界最速のハリネズミなので、ゲームは猛スピードで進行する。ゲームではいくつかの興味深い物理現象も表現されており、AIエージェントがひとたびプレイ方法を学べば、その知識を異なるシナリオに適用するAIエージェントの能力を容易にテストできる。
これらのアルゴリズムは、一度、訓練すれば現実世界に適用できるかもしれない。たとえば、ロボットの移動の改善に利用できる可能性がある。従来のロボットの移動方法は、特定の状況に特化したものだった。つまり、新しい場所では、これまでの方法で移動するようにプログラムされたロボットは転倒してしまう可能性がある。シュルマンは、強化学習を用いるロボットであれば、転倒しないように何度でも起き上がって、新しい方法を試すようになるだろうと期待している。
(キャサリン・ブーザック)
- 人気の記事ランキング
-
- AI can make you more creative—but it has limits 生成AIは人間の創造性を高めるか? 新研究で限界が明らかに
- Promotion Call for entries for Innovators Under 35 Japan 2024 「Innovators Under 35 Japan」2024年度候補者募集のお知らせ
- A new weather prediction model from Google combines AI with traditional physics グーグルが気象予測で新モデル、機械学習と物理学を統合
- How to fix a Windows PC affected by the global outage 世界規模のウィンドウズPCトラブル、IT部門「最悪の週末」に
- The next generation of mRNA vaccines is on its way 日本で承認された新世代mRNAワクチン、従来とどう違うのか?
タグ | |
---|---|
クレジット | Photograph by Eric Louis Haines |
著者 | MIT Technology Review編集部 [MIT Technology Review Editors] |