ロボット版「イメージネット」目指す、UCバークレーの巨大映像DB
ニューラル・ネットワークを用いてロボットに新しいタスクを学習させようとすると、大量の学習用データを用意する必要がある。カリフォルニア大学バークレー校の研究者らは、ロボットを動かすニューラルネットを訓練するための映像を大量に蓄積した公開データベースを作成しようとしている。 by Emerging Technology from the arXiv2019.11.15
人工知能(AI)革命の陰の立役者として、データベースである「イメージネット(ImageNet)」の存在がある。プリンストン大学の研究者が開発したイメージネットには、約1400万枚の画像が含まれ、各画像には画像内容を説明する注釈テキストがクラウドソーシングで付けられている。
イメージネットは現在の高性能ニューラル・ネットワークの多くが初期経験を積むのに使う重要なデータベースだ。ニューラル・ネットワークはデータベース上の画像と付随テキストを使って学習し、データベースが大きいほど学習効果が上がる。イメージネットやその他の画像データセットがなければ、最も高性能なニューラル・ネットワークでさえ何も認識できない。
ロボット工学者は現在、同様の手法で、映像を使って、周囲の環境との相互作用の方法をニューラル・ネットワークに学習させたいと考えている。カリフォルニア大学バークレー校の大学院生であるスディープ・ダサリらの研究チームが作成している「ロボネット(RoboNet)」と呼ばれるデータベースは、まさにその目的を達成するためのものだ。ロボネットには、テーブルの向こう側へカップを動かすロボットの映像データなど、動作中のロボットの注釈付き映像データが多数含まれている。ロボネットのデータは誰でもダウンロードでき、ロボットを制御するニューラル・ネットワークの訓練に使える。訓練によって、たとえば、そのニューラル・ネットワークがカップを扱うのが初めてだとしても、カップを動かせるようになる。
ダサリらの研究チームは、ロボネットを、ほぼすべてのロボットに対し、ほぼすべてのタスクの実行を事前に訓練させられるリソースに成長させたいと考えている。いわば、一種の「ロボット大学」である。
ロ …
- 人気の記事ランキング
-
- Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
- Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
- Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
- Text-to-image AI models can be tricked into generating disturbing images AIモデル、「脱獄プロンプト」で不適切な画像生成の新手法
- What is the chance your plane will be hit by space debris? 空からゴミが降ってくる—— 衛星10万基時代のリスク、 航空への影響は?【解説】
