KADOKAWA Technology Review
×
来れ、若きイノベーター! Innovators Under 35 Japan 2022 応募受付中!
子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ
Tang Ming Tung / Getty
An AI algorithm inspired by how kids learn is harder to confuse

子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ

深層学習では、機械学習モデルの正確さを高めるには訓練用データの量を増やすことが一般的だ。カーネギーメロン大学の研究者らは、親が子どもに教える方法にヒントを得て、データ量を増やさなくてもモデルの正確さを高められる学習アルゴリズムを見い出した。 by Karen Hao2020.05.11

機械学習アルゴリズムを訓練する標準的な方法は、すべての詳細情報を一度に与えることだ。さまざまな動物の種類を認識する画像分類システムを構築している場合であれば、各種類の例を示し、それに応じてラベルを付ける。たとえば、犬の場合であれば「ジャーマンシェパード」や「プードル」といった具合だ。

だが、人間の親が子どもに何かを教えるときのアプローチはまったく異なる。親ははるかに広範なラベルで始める。どんな犬種であっても最初は単に「犬」である。子どもがこうしたより単純なカテゴリを区別する方法を学習した後に初めて、親はそれぞれをより詳細な種類に分類する。

このアプローチに発想を得て、カーネギーメロン大学の研究者は、物事を段階的に分類することをニューラルネットワークに教える新しい方法を編み出した。ネットワークは訓練の各段階で同じ訓練用データを参照するが、ラベルはシンプルで幅広いものから始まり、訓練の段階が進むにつれてより具体的になる。

訓練の段階の進捗を判断するために、研究者らは、最初にニューラルネットワークに訓練用データと最終的な詳細ラベルを示した。それから、人工知能(AI)モデルが区別するのがもっとも難しかったカテゴリを示す「混乱マトリックス」を計算して訓練の進捗具合を判断した。訓練では、初期段階で最も区別がつきにくかったカテゴリを1つのラベルの下でグループ化し、その後の繰り返しで、それらを細かいラベルに分割し直していった。

いくつかの一般的な画像分類データセットを使用してテストした結果、ほとんどの場合、このアプローチで最終的に得られた機械学習モデルは、従来の方法で訓練したモデルより優れていた。もっともよい場合で、分類の正確さが7%も向上した。

今回のアプローチは新しいものだが、その背後にあるアイデア自体はそうではない。難易度を段階的に高めてニューラルネットワークを訓練することは「カリキュラム学習」として知られており、1990年代から存在している。ただし、これまでのカリキュラム学習では、ニューラルネットワークの訓練の各段階で、異なるデータのサブセットを使うことを重視している。同じデータに異なるラベルを付けて各段階の訓練に使う今回の手法は、4月26日から5月1日に開催されたバーチャルICLR( International Conference of Learning Representations、学習表現に関する国際会議)で、論文の共著者であるオティリア・ストレッツによって発表された

広範にわたる今日の深層学習研究の大半は、モデルのサイズに重きを置いている。画像分類システムが異なる物体を区別することが困難な場合、それは十分な例で訓練されていないことを意味する。しかし、スレッツらは人間の学習方法から洞察を得て、まったく同じ訓練用データを使ってより良い結果を得られる新しい方法を見い出した。今回の成果は、よりデータ効率の高い学習アルゴリズムを作成する方法のヒントとなるだろう。

人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Call for entries for Innovators Under 35 Japan 2022 IU35 Japan 2022候補者募集を開始、今年は医学/生物工学も対象
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
カーレン・ハオ [Karen Hao]米国版 AI担当記者
MITテクノロジーレビューの人工知能(AI)担当記者。特に、AIの倫理と社会的影響、社会貢献活動への応用といった領域についてカバーしています。AIに関する最新のニュースと研究内容を厳選して紹介する米国版ニュースレター「アルゴリズム(Algorithm)」の執筆も担当。グーグルX(Google X)からスピンアウトしたスタートアップ企業でのアプリケーション・エンジニア、クオーツ(Quartz)での記者/データ・サイエンティストの経験を経て、MITテクノロジーレビューに入社しました。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Call for entries for Innovators Under 35 Japan 2022 IU35 Japan 2022候補者募集を開始、今年は医学/生物工学も対象
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
MITテクノロジーレビュー[日本版] Vol.7
MITテクノロジーレビュー[日本版] Vol.7世界を変える10大技術 2022年版

パンデミック収束の切り札として期待される「新型コロナウイルス感染症(COVID-19)飲み薬」、アルファ碁の開発企業が作った「タンパク質構造予測AI」、究極のエネルギー技術として期待が高まる「実用的な核融合炉」など、2022年に最も注目すべきテクノロジー・トレンドを一挙解説。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る