KADOKAWA Technology Review
×
開拓者
35歳未満のイノベーター35人 2018開拓者
よりよい遺伝子編集、より賢い人工知能(AI)、より安全なインターネットへと導く。

John Schulman ジョン・シュルマン (30)

所属: オープンAI

AIエージェントが訓練で得た知識を新しい状況に適応できるように、自ら試行錯誤するという重要なアルゴリズムを開発している。

オープンAI(OpenAI)の研究科学者ジョン・シュルマンは、「強化学習」と呼ばれる機械学習の分野で、重要なアルゴリズムをいくつか開発した。その名の通り、強化学習は正しい反応に対して褒美を与えることで、犬を訓練するのと同じように人工知能(AI)エージェントを訓練する。機械にとっての「褒美」は、たとえばビデオゲームで高得点を獲得するといったことだ。

1991年に登場したビデオ・ゲーム「ソニック・ザ・ヘッジホッグ(Sonic the Hedgehog)」についてシュルマンが熱心に語るのは、それが理由だ。シュルマンによると、このゲームは、新しい機械学習アルゴリズムが学習したスキルを新しい状況にいかにうまく適用するかを測るのに理想的なベンチマークになるという。ソニックは世界最速のハリネズミなので、ゲームは猛スピードで進行する。ゲームではいくつかの興味深い物理現象も表現されており、AIエージェントがひとたびプレイ方法を学べば、その知識を異なるシナリオに適用するAIエージェントの能力を容易にテストできる。

これらのアルゴリズムは、一度、訓練すれば現実世界に適用できるかもしれない。たとえば、ロボットの移動の改善に利用できる可能性がある。従来のロボットの移動方法は、特定の状況に特化したものだった。つまり、新しい場所では、これまでの方法で移動するようにプログラムされたロボットは転倒してしまう可能性がある。シュルマンは、強化学習を用いるロボットであれば、転倒しないように何度でも起き上がって、新しい方法を試すようになるだろうと期待している。

(キャサリン・ブーザック)

人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
  4. These hackers showed just how easy it is to target critical infrastructure 発電所も使う通信プロトコルのハッキング、わずか2日で攻略
人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
  4. These hackers showed just how easy it is to target critical infrastructure 発電所も使う通信プロトコルのハッキング、わずか2日で攻略
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る