KADOKAWA Technology Review
×
【3/14】MITTR主催「アクセシビリティとテクノロジー 」開催 申込受付中
Machines Can Now Recognize Something After Seeing It Once

グーグル・ディープマインド、大量データ不要の深層学習システムを開発

アルゴリズムの学習には通常何千ものサンプルが必要とされる。グーグル・ディープマインドの研究者はその手間の回避方法を見つけた。 by Will Knight2016.11.04

人間は一、二度見ればそれが何かを認識できる。しかし、コンピュータービジョンや音声認識のアルゴリズムは、画像や言葉の習熟に何千ものサンプルが必要だ。

グーグル・ディープマインドの研究者がこの手間を回避する方法を発見した。研究者は深層学習アルゴリズムを巧妙に微調整することで、画像内の物体等をひとつのサンプルだけで認識(分類)する「ワンショット学習」を可能にした。研究チームはタグ付き画像や筆跡、言語を収録した大型データベースで、新方式を実証した。

高精度のアルゴリズムの認識力は信頼できるが、アルゴリズムの構築には多くのデータが必要で、時間もお金もかかる。たとえば、無人自動車が、確実に道路上の個々の自動車を「自動車」という概念でひとくくりに認識するためのアルゴリズムには何千もの実例が必要だ。膨大なデータを収集するのは往々にして非現実的だ。たとえば、自宅でロボットが迷子にならないためには、膨大な時間をかけて家の中を廻り、学習する必要がある。

人工知能を開発するアルファベット(グーグル)の英国子会社グーグル・ディープマインドのオリオル・ビニアル研究員は、深層学習システム(神経回路網の一種で、脳内のニューロンのように相互接続された構成要素の層のそれぞれの感度を調節することで物体を認識する仕組み)に記憶機能を追加した。一般的に、深層学習システムは人工神経網の接続を微調整するために多くの画像が必要だ。

研究チームはイメージネットと呼ばれるラベル付きの画像データベースを使い、システムの能力を証明した。ソフトウェアは初めに数百種類のイメージを分析する必要があるが、その後は1枚の画像だけ(たとえば犬の写真1枚)で何かを認識(分類)できるようになる。システムは効率よく、何かを識別するための特徴を学習する。新しいアルゴリズムは、たった1枚のサンプルを見ただけで、データ量に頼っていた従来型システムとほぼ同じレベルの認識力を発揮した。

ビニアル研究員によると、システムが新しい単語の意味を素早く認識できるのは特に有用だ。 システムが 検索する言葉の意味を即座に学習できれば、(検索事業を改善できる可能性がああるため)グーグルには特に重要だ。

他の研究者が開発中のワンショット学習システムは、ほとんどの場合、深層学習システムと互換性がない。昨年、ある学術系のプロジェクトでは確率的プログラミングの手法で、同様に効率的な学習を可能にした。(「私たちと同じ速さで学習するアルゴリズム」参照)。

しかし、 深層学習システム(特に記憶機能が追加されたシステム)の性能は高まりつつある。最近、グーグル・ディープマインドの他のグループは順応性の高い記憶機能を備えたネットワークを開発した。ネットワークは単純な論理的タスク(たとえば単純なネットワーク図表を分析することで地下鉄路線の効率的な乗り継ぎ方法を学習する)を処理できる(「コンピューターにワーキングメモリーを与えたら?」参照)。

「この手法はとても面白いです。大規模データセットに対して、ワンショット学習を導入できる新手法です」というのは韓国太田市の韓国科学技術院(KAIST)で脳と機械の知能を研究するチームを率いるサン・ワン・リー研究員だ。「これは人工知能(AI)コミュニティーへの技術貢献です。コンピュータービジョン研究者が待ち望んでいたものです」とリーはいう。

人間の学習とは依然として異なるとして、実用性に懐疑的な人もいる。ハーバード大学脳科学学部のサム・ガーシュマン准教授は、その理由のひとつをこう説明する。まず、人間は画像を構成する「部分」を理解した上で学習する。学習プロセスでは、たとえば、「セグウェイは自転車やオートバイと見た目は違うかもしれないが、どれも同じ部品で組み立てられている」といった現実世界の知識あるいは一般常識的が必要になる。

ガーシュマン准教授とリー研究員によると、機械が人間の学習レベルに追いつくのにはまだ時間がかかる。「人間のワンショット学習の秘密の解明はまだ先のことです。しかし、今回の成果は将来の研究に必ず役にたつ課題を提示しています」とワン・リーはいう。

人気の記事ランキング
  1. Watch this robot as it learns to stitch up wounds AIロボットが縫合技術を習得、6針縫うことに成功
  2. Promotion MITTR Emerging Technology Nite #27 MITTR主催「アクセシビリティとテクノロジー 」開催のご案内
  3. OpenAI teases an amazing new generative video model called Sora 動画でも生成革命、オープンAIが新モデル「Sora」を発表
  4. People are worried that AI will take everyone’s jobs. We’ve been here before. 生成AIは雇用を奪うのか? MIT学長が書いた 85年前の記事に学べること
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Watch this robot as it learns to stitch up wounds AIロボットが縫合技術を習得、6針縫うことに成功
  2. Promotion MITTR Emerging Technology Nite #27 MITTR主催「アクセシビリティとテクノロジー 」開催のご案内
  3. OpenAI teases an amazing new generative video model called Sora 動画でも生成革命、オープンAIが新モデル「Sora」を発表
  4. People are worried that AI will take everyone’s jobs. We’ve been here before. 生成AIは雇用を奪うのか? MIT学長が書いた 85年前の記事に学べること
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る