KADOKAWA Technology Review
×
AI Begins to Understand the 3-D World

人工知能は二次元を卒業し、三次元のモノに興味を持ちだした

人工知能に関する研究は、二次元を超えて三次元を理解させるステージに移行—ロボット工学や自動運転の分野での大きな進歩につながる可能性を秘めた動き by Will Knight2016.12.12

Researchers at UC Berkeley are working with a machine from Rethink Robotics to help AI gain an understanding of how objects in the real world can be manipulated.
カリフォルニア大学バークレー校 (UCバークレー) の研究者は、リシンク・ロボティクスのロボットを使って、AIに現実世界にあるモノの扱い方を理解させようとしている

人工知能は近年、見事に盛り上がっているが、その実態はまったく平坦だ。

現在、AI研究者は二次元画像とピクセルの世界から抜け出そうとしている。その代わりにAI研究者が構築しているのは、三次元で世界を理解し、行動できるシステムだ。研究が成果を出せば、ロボット工学や自動運転車に大きな影響を与え、現実世界の中でより賢く行動する方法を学習する機械を開発しやすくするだろう。

「学習に基づく視覚システムが二次元の画像を解析するだけの段階から三次元空間にあるモノを認識する段階に移行するのは、将来が楽しみで重要なトレンドです」とマサチューセッツ工科大学(MIT)のジョシュ・テネンバウム教授(脳・認知科学学部)はいう。

「奥行きを伴ってモノを視認し、形を完全にモデル化するのです。単にピクセルのパターンを、犬とネコ、椅子とテーブルに認識させるのではありません」

テネンバウム教授が率いる研究チームが最近注目の機械学習手法「競争式生成モデル(GAM:Generative Adversarial Modeling)」を使って、コンピューターに現実のモノを参考に、三次元世界の特性を学習させたところ、写実的かつ物理的に正確に新しいモノを生成できるようになった。研究チームは、先週スペインのバルセロナで開かれたNITS (神経情報処理システム) カンファレンスで研究成果を発表した

競争式生成モデルはコンピューターに現実世界を学習させるひとつの手法にすぎない、とテネンバウム教授はいう。認知科学の研究成果によれば、人間は何らかの三次元モデルを利用して認識し行動しているようだ。たとえば見慣れないモノに出くわしたとき、人間は三次元画像を脳内で生成し、それがどんなモノなのか把握しようとしているようだ。さらに物理世界に関する理解 (テーブルは重たく、椅子に座ってのけぞるとひっくり返るといった事実)を使って行動している。テネンバウム教授の主張によれば、人工知能が三次元世界を認識できれば、より高度な知性(論理的思考や言語能力まで)を構築できるという。

機械が三次元世界を理解できれば、近い将来、社会的に重要で、実用性の高い分野に応用できるはずだ。「現実世界と関わるロボットを開発するなら三次元認識はどうしても必要なのです」とタネンバウム教授はいう。「ロボットは、現実世界が三次元であり、世界にはモノがある事実を理解する必要があります」

NIPSに参加した研究者の多くは、簡略化した三次元世界内部で機械学習システムを利用して実験を進めている。こういった動きにより、まずは単純な概念をロボットに認識させ検証することで、やがては現実世界に応用できる道が見えてくる。たとえば、マイクロソフトの研究グループは、コンピューターゲーム「マインクラフト」の実験版に組み込んだ機械学習システムを披露した。

AI研究者向けに、さまざまなバーチャル三次元環境が開発されているので、この分野における研究はさらに進むはずだ。(「ディープマインドがAIエージェントの学習環境にDOOM型バーチャル世界を公開」と 「AI研究者の皆さん、オープンAIが強化学習に使えるプラットフォームを公開です」参照)。

ロボットに注目した研究は他でも進んでいる。カリフォルニア大学バークレー校 (UCバークレー) のセルゲイ・レヴァイン助教授が率いる研究チームは、映像認識と実験を組み合わせて現実世界について学習するシステムを披露した。セルゲイ助教授のロボットは物体を突いて、そこで生じる結果を考察することで実験し、モノの物理的性質についての初歩的な理解を積み重ね、学習内容を応用して新しい行動を起こせる。たとえば、あるモノを何千回も突いた後、ロボット(リシンク・ロボティクスの産業用ロボットのテスト版)は、同じモノを別の場所に動かせるようになる。

現実世界でどう行動すべきかを理解させることが、AI全般が進歩するには重要だと信じているのはテネンバウム教授だけではない。オックスフォード大学の ナノ・デ・フレイタス教授は講演で、 現実世界を実際に探らせないと、AIの進歩は中途半端な段階にとどまるだろうと述べた。「物理の仕組みを理解させるには、モノと関わらせるしかありません。ピクセルを通じて学習するだけでは足らないのです」

人気の記事ランキング
  1. Three reasons robots are about to become more way useful  生成AI革命の次は「ロボット革命」 夢が近づく3つの理由
  2. Job titles of the future: AI prompt engineer 未来の職種:LLMを操る「プロンプト・エンジニア」は生き残るか
  3. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
タグ
クレジット Image courtesy of the University of California, Berkeley
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Three reasons robots are about to become more way useful  生成AI革命の次は「ロボット革命」 夢が近づく3つの理由
  2. Job titles of the future: AI prompt engineer 未来の職種:LLMを操る「プロンプト・エンジニア」は生き残るか
  3. Why it’s so hard for China’s chip industry to become self-sufficient 中国テック事情:チップ国産化推進で、打倒「味の素」の動き
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る