KADOKAWA Technology Review
×
【新規購読者限定】ひと月あたり1000円で始められるキャンペーン実施中!
米独大学の研究グループ、家庭内ロボ訓練用の巨大データ集を作成
A Massive New Library of 3-D Images Could Help Your Robot Butler Get Around Your House

米独大学の研究グループ、家庭内ロボ訓練用の巨大データ集を作成

家庭で仕事をこなすロボットを開発するには、家庭にあるモノを認識し、場面全体がどんな状況にあるのかをコンピューターが認識する必要がある。米独の大学の研究グループは、3D画像の訓練用巨大データ集を作成した。 by Will Knight2017.04.26

ロボットが家庭で実際に仕事をこなすには、コーヒー・テーブルとベビー・ベッドを区別する能力が必要だ。

スタンフォード大学とプリンストン大学、ミュンヘン工科大学の研究者が新開発した大容量3D画像データセットなら、人工知能を訓練できるかもしれない。画像データセット「スキャンネット」は、コーヒー・テーブルやソファ、電気スタンド、テレビなど、数百万件もの説明情報(注釈データ)付きの、何千もの場面を網羅している。コンピューター・ビジョンが過去5年間で飛躍的に進歩した一因に、スタンフォード大学の研究グループ(スキャンネットに参加したのは別の研究グループ)が開発したデータセット「イメージネット」(ずっとシンプルな2Dの標識化画像データセット)の貢献がある。スキャンネットはさらに大量のデータで認識精度向上に貢献するだろう。

スキャンネットの開発に携わったミュンヘン工科大学のマティアス・ ナイセル教授は「イメージネットは注釈データの量が半端ではなく、それによって人工知能革命を引き起こしました」という。

スキャンネットにより、機械が物理的世界をより深く理解し、実用的な応用につながることが期待される。ナイセル教授は「誰もが思いつくのは家庭用ロボットです。家庭用ロボットは、周囲で何が起きているかを判断しなければなりません」という。

スタンフォード大学の客員准教授時代に開発に携わったナイセル教授は、コンピューターが三次元で場面を理解するよう訓練するために深層学習(イメージネットに使われているのと同じ機械学習の手法)を応用することになると考えている(“10 Breakthrough Technologies 2013: Deep Learning”参照)。ナイセル教授は、スタンフォード大学時代の学生アンジェラ・ダイ、プリンストン大学のトーマス ・ ファンクハウザー教授、他の学生数名とスキャンネットを開発した。

研究内容は、研究グループが最近Webに投稿した論文で説明されている。研究グループは、マイクロソフトのキネクトに似た3Dカメラで1513場面をスキャンしてデータセットを作った。3Dカメラは、従来型カメラと赤外線深度センサーを使って、撮影中の場面の3D画像を生成する。さらに研究グループは、アマゾンのクラウド・ソーシング「メカニカル・ターク」(人間の作業者を動的に割り当てるサービス)を通じて、ボランティアにiPadアプリで画像に注釈をつけてもらった。全体の精度を上げるために、ボランティアの一方がスキャン画像内のモノを塗り分けてラベルを付け、もう一方のボランティアには3Dモデルで場面を新たに作るよう依頼した。

家庭用ロボットの実用化を研究しているブラウン大学のステファニー・テレクス助教授は、スキャンネットは以前のどの研究にも優る大きな成果だという。「大規模なデータセットを作り上げたのは大きな貢献です。3D情報は、ロボットが環境を認知して、反応するのに不可欠です」

ナイセル教授は、研究グループが深層学習を適用してみたところ、奥行き情報や形状だけで、機械は多くのモノを十分な精度で認識できるとわかったという。3Dデータによって、機械は物理的世界をより深く理解できるとわかったが、3D情報の活用は、動物がモノを認知する手法をまねたよい方法だ、とナイセル教授はいう。

カーネギーメロン大学のシダルタ・ シュリニバーサ教授(ロボット工学)は、新たなデータセットは機械が家庭内を理解する「よいスタート」になりうるという。シュリニバーサ教授は「イメージネットの人気は、部分的にはデータセットの膨大さにありますが、概して、画像のラベルがそのまま数多くの分野、特にWebアプリに応用できたことが大きかったのです」という。一方、3D画像データセットの明白な応用分野はロボット工学や建築学に限られている。ただしシュリニバーサ教授は、応用分野は急速に出現するだろう、と述べた。

シュリニバーサ教授は、人工的またはバーチャルな場面でマシン・ビジョン・システムを訓練する研究者もいるという。「現実の画像は非現実的にしかシミュレートできないこともありますが、映画のコンピューター合成画像(CGI)でわかるように、奥行き情報のシミュレートは十分現実的です」

人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
MITテクノロジーレビュー[日本版] Vol.7
MITテクノロジーレビュー[日本版] Vol.7世界を変える10大技術 2022年版

パンデミック収束の切り札として期待される「新型コロナウイルス感染症(COVID-19)飲み薬」、アルファ碁の開発企業が作った「タンパク質構造予測AI」、究極のエネルギー技術として期待が高まる「実用的な核融合炉」など、2022年に最も注目すべきテクノロジー・トレンドを一挙解説。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る