KADOKAWA Technology Review
×

ニューズラインエマージング・テクノロジーの最新情報をお届け。

AIの失敗に学ぶ、新方式のロボット訓練フリーソフトが公開
OpenAI
There’s a new way to have robots learn from their mistakes

AIの失敗に学ぶ、新方式のロボット訓練フリーソフトが公開

1つの作業におけるすべての誤った行動を、別の作業の一部で使えるかどうかを考えることで、人工知能(AI)に後知恵を与えることができる。

人間は失敗をすると、いくつかのことを学ぶことができる。たとえば、さっきの作業でやってみたアプローチがうまくいかなかったが、その方法は他の作業で役立つかもしれない、といったことなどだ。しかし、ロボットが単独でタスクを習得しようとするときは通常、正しく実行した仕事の各段階に対して報酬を得ることによってのみ学習する。

IEEEスペクトラム(IEEE Spectrum)の伝えるところによると、非営利の研究機関であるオープンAI(OpenAI)がリリースしたフリーソフトウェア「ハインドサイト・エクスペリエンス・リプレイ(Hindsight Experience Replay=HER)」は、AIの「失敗」から成功を引き出すことができるという。 これは、1つの作業をするためのすべての試みが、他の作業にどのように適用できるかを調べることによって実現する。HERにはバーチャルな環境も含まれており、AIが物を拾ったり、ペンを持ったりする練習ができる。

HERがロボットを訓練する方法は、より現実的だ。作業の1つの段階がうまくできただけではロボットに報酬を与えず、すべてが適切に実行された場合にのみ報酬を与えるのだ。ロボットが実際の生活で学習するやり方に近いが、通常は訓練が遅くなってしまう。 それでもなお、失敗した試みはすべて別の仕事にも使うことができるため、オープンAIのシステムではたいした問題ではない。

jackie.snow [Jackie Snow] 2018.03.01, 11:55
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
MITテクノロジーレビューは有料会員制サイトです
有料会員になると、毎月150本以上更新されるオリジナル記事が読み放題!
【春割】実施中! ひと月あたり1,000円で読み放題
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る