KADOKAWA Technology Review
×
発表!MITテクノロジーレビューが選ぶ
2022年のイノベーター14人。
【12/15 Summit開催】
子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ
Tang Ming Tung / Getty
An AI algorithm inspired by how kids learn is harder to confuse

子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ

深層学習では、機械学習モデルの正確さを高めるには訓練用データの量を増やすことが一般的だ。カーネギーメロン大学の研究者らは、親が子どもに教える方法にヒントを得て、データ量を増やさなくてもモデルの正確さを高められる学習アルゴリズムを見い出した。 by Karen Hao2020.05.11

機械学習アルゴリズムを訓練する標準的な方法は、すべての詳細情報を一度に与えることだ。さまざまな動物の種類を認識する画像分類システムを構築している場合であれば、各種類の例を示し、それに応じてラベルを付ける。たとえば、犬の場合であれば「ジャーマンシェパード」や「プードル」といった具合だ。

だが、人間の親が子どもに何かを教えるときのアプローチはまったく異なる。親ははるかに広範なラベルで始める。どんな犬種であっても最初は単に「犬」である。子どもがこうしたより単純なカテゴリを区別する方法を学習した後に初めて、親はそれぞれをより詳細な種類に分類する。

このアプローチに発想を得て、カーネギーメロン大学の研究者は、物事を段階的に分類することをニューラルネットワークに教える新しい方法を編み出した。ネットワークは訓練の各段階で同じ訓練用データを参照するが、ラベルはシンプルで幅広いものから始まり、訓練の段階が進むにつれてより具体的になる。

訓練の段階の進捗を判断するために、研究者らは、最初にニューラルネットワークに訓練用データと最終的な詳細ラベルを示した。それから、人工知能(AI)モデルが区別するのがもっとも難しかったカテゴリを示す「混乱マトリックス」を計算して訓練の進捗具合を判断した。訓練では、初期段階で最も区別がつきにくかったカテゴリを1つのラベルの下でグループ化し、その後の繰り返しで、それらを細かいラベルに分割し直していった。

いくつかの一般的な画像分類データセットを使用してテストした結果、ほとんどの場合、このアプローチで最終的に得られた機械学習モデルは、従来の方法で訓練したモデルより優れていた。もっともよい場合で、分類の正確さが7%も向上した。

今回のアプローチは新しいものだが、その背後にあるアイデア自体はそうではない。難易度を段階的に高めてニューラルネットワークを訓練することは「カリキュラム学習」として知られており、1990年代から存在している。ただし、これまでのカリキュラム学習では、ニューラルネットワークの訓練の各段階で、異なるデータのサブセットを使うことを重視している。同じデータに異なるラベルを付けて各段階の訓練に使う今回の手法は、4月26日から5月1日に開催されたバーチャルICLR( International Conference of Learning Representations、学習表現に関する国際会議)で、論文の共著者であるオティリア・ストレッツによって発表された

広範にわたる今日の深層学習研究の大半は、モデルのサイズに重きを置いている。画像分類システムが異なる物体を区別することが困難な場合、それは十分な例で訓練されていないことを意味する。しかし、スレッツらは人間の学習方法から洞察を得て、まったく同じ訓練用データを使ってより良い結果を得られる新しい方法を見い出した。今回の成果は、よりデータ効率の高い学習アルゴリズムを作成する方法のヒントとなるだろう。

人気の記事ランキング
  1. Here’s how a Twitter engineer says it will break in the coming weeks ツイッターで「非公式RT」が一時復活、崩壊の始まりか
  2. Former Twitter employees fear the platform might only last weeks 「ハードコア」大量離職で、元従業員らがツイッターに余命宣告
  3. We could run out of data to train AI language programs  大規模言語AIにアキレス腱、訓練用データが2026年にも枯渇か
  4. President Biden reveals the James Webb Space Telescope’s “poetic” first image of the universe ジェームズ・ウェッブ宇宙望遠鏡の最初の写真、130億年前の銀河も
カーレン・ハオ [Karen Hao]米国版 AI担当記者
MITテクノロジーレビューの人工知能(AI)担当記者。特に、AIの倫理と社会的影響、社会貢献活動への応用といった領域についてカバーしています。AIに関する最新のニュースと研究内容を厳選して紹介する米国版ニュースレター「アルゴリズム(Algorithm)」の執筆も担当。グーグルX(Google X)からスピンアウトしたスタートアップ企業でのアプリケーション・エンジニア、クオーツ(Quartz)での記者/データ・サイエンティストの経験を経て、MITテクノロジーレビューに入社しました。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. Here’s how a Twitter engineer says it will break in the coming weeks ツイッターで「非公式RT」が一時復活、崩壊の始まりか
  2. Former Twitter employees fear the platform might only last weeks 「ハードコア」大量離職で、元従業員らがツイッターに余命宣告
  3. We could run out of data to train AI language programs  大規模言語AIにアキレス腱、訓練用データが2026年にも枯渇か
  4. President Biden reveals the James Webb Space Telescope’s “poetic” first image of the universe ジェームズ・ウェッブ宇宙望遠鏡の最初の写真、130億年前の銀河も
MITテクノロジーレビュー[日本版] Vol.8
MITテクノロジーレビュー[日本版] Vol.8脱炭素イノベーション

2050年のカーボンニュートラル(炭素中立)の実現に向けて、世界各国で研究開発が加速する脱炭素技術、社会実装が進む気候変動の緩和・適応策などGX(グリーン・トランスフォーメーション)の最新動向を丸ごと1冊取り上げる。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る