KADOKAWA Technology Review
×
How Moss Helped Machine Vision Overcome an Achilles’ Heel

京都の「コケ」を識別する手法が深層学習の弱点を克服する

深層学習の手法に基づく物体認識は、特徴がはっきりしないものを識別するのが苦手だ。京大の伊勢准教授らが開発した「コケ」の種類を識別する手法は、この弱点を克服する有望な方法となりそうだ。 by Emerging Technology from the arXiv2017.08.18

近年、深層学習アルゴリズムが機械による物体認識に革命を起こしている。テーブル、イス、自動車、さらには人の顔といったありふれた物の識別において、最先端のアルゴリズムは人間を易々としのぐようになった。

しかし、深層学習アルゴリズムには弱点があり、認知できないものが存在する。たとえばマシン・ビジョンは、草やハーブなどの識別が苦手だ。形状が定まっておらず、特徴を定義しづらいからだ。

テーブルは一般的に、4本の脚と1つの平らな面を持つ。機械学習はこういった特徴を識別するのが得意だ。一方、草やハーブは同一種であっても、生育条件によって大きさはさまざまであり、葉や種の数なども異なる。そのため、マシン・ビジョンによる認識は困難であり、花が咲いていない時期には特に難しい。

マシン・ビジョンは同様に、航空写真から樹木を識別したり、衛星画像から穀物を識別したりするのも苦手だ。はっきりしない形の物体も識別できるように深層学習アルゴリズムを訓練するための新しいアプローチが求められている。

京都大学の伊勢武史准教授たちは、深層学習機械が不定形の植物を認識できるようにするシンプルな技術を開発して、さまざまな種類のコケを識別するように教え込んで性能を試した。 ご存知のように、コケは形状をはっきりと定義するのが難しい植物である。

伊勢准教授たちの研究チームは、コケを研究するのに適した環境に恵まれている。京都は温かく湿度の高い気候で知られており、コケが育ちやすい。研究チームはまず、京都の伝統的な日本庭園である「無鄰菴(むりんあん)」に生育しているコケの写真撮影から始めた。

研究チームは3種類のコケを特定し、それぞれを個別にデジタルカメラで撮影した。しかし、コケの生育場所にはコケ以外の他の植物なども一緒に生えている。それぞれの画像は、オリンパス OM-D E-M5 Mark IIなどのデジタルカメラを用いて、焦点距離50ミリまたは同等のレンズで、60センチの距離でコケの塊を上から直接撮影したもので、解像度は4608 × 3456ピクセルである。

深層学習アルゴリズムの目標は、1枚の画像に写った異なる種類のコケを識別することと、他の物体や植物からコケを見分けることである。

手法は単純明快だ。アルゴリズムを訓練するために、特定のコケのそれぞれの画像を50%重複させながら、56 × 56ピクセルの小さな領域に分割する。この手法で元の画像から9万近くの画像を作り出し、そのうち80%をアルゴリズムの訓練に、残りを訓練したアルゴリズムのテストに使用する。

訓練用の画像は特定の種類のコケの均一な塊を写したものを選んだが、塊には他種のコケが生えている部分も少し含まれている。研究チームはすべての訓練用画像を調べて、スギゴケ、チョウチンゴケ、ハイゴケの3種類以外のコケの画像を手作業で取り除いた。この作業により、上記3種類のコケと、コケ以外の特徴の画像が残された。伊勢准教授たちはそれから、訓練用のすべての画像にいずれか一つのラベルを付けて深層学習機械に与えた。

結果は見事なものだった。アルゴリズムはすぐに、高い精度で各種類のコケを認識するようになった。様々な種類のコケが写った1枚の画像をアルゴリズムに与えると、画像の様々な部分にあるコケを正確に識別した。「テスト用の画像を90%以上の精度で分類しました」という。

アルゴリズムは、ある種のコケを他のコケよりも正確に識別した。伊勢准教授たちは、「識別精度は、スギゴケで99%、チョウチンゴケで95%、ハイゴケで74%と見積もれます」としている。

ハイゴケの精度が低いのは、生長の形態が明確でなく、他のコケより形状がはっきりしないためである。これに対し、スギゴケは独特の明確な形状を持っている。

精度を改善するにはさまざまな方法が考えられるという。例えば、ハイゴケがより特徴的に見える別の季節に撮影した画像を訓練用に作成したり、デジタルカメラのホワイトバランスを統一することでより正確に色を再現したりすることなどが挙げられる。

いずれにせよ、結果から判断すると、将来は有望そうだ。伊勢准教授たちの手法は、航空画像で上空から撮影された木や植物をより正確に識別するのに応用できる可能性がある。荒野や農場、森林などの広大な管理区域での個体数調査では大いに役立つだろう。

一方で伊勢准教授たちは、スマホを使ってコケを識別するアプリの開発を計画しているとしており、園芸家に人気となるかもしれない。

(参照:arxiv.org/abs/1708.01986 : “Identifying 3 moss species by deep learning, using the “chopped picture” method(「細切れ写真」手法によって深層学習で3種類のコケを識別する)

人気の記事ランキング
  1. An ancient man’s remains were hacked apart and kept in a garage 切り刻まれた古代人、破壊的発掘から保存重視へと変わる考古学
  2. This startup just hit a big milestone for green steel production グリーン鉄鋼、商業化へ前進 ボストン・メタルが1トンの製造に成功
  3. AI reasoning models can cheat to win chess games 最新AIモデル、勝つためなら手段選ばず チェス対局で明らかに
  4. OpenAI has released its first research into how using ChatGPT affects people’s emotional wellbeing チャットGPTとの対話で孤独は深まる? オープンAIとMITが研究
エマージングテクノロジー フロム アーカイブ [Emerging Technology from the arXiv]米国版 寄稿者
Emerging Technology from the arXivは、最新の研究成果とPhysics arXivプリプリントサーバーに掲載されるテクノロジーを取り上げるコーネル大学図書館のサービスです。Physics arXiv Blogの一部として提供されています。 メールアドレス:KentuckyFC@arxivblog.com RSSフィード:Physics arXiv Blog RSS Feed
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る