「見分け方」を学習、説明できる画像認識=MITなど開発
人間の「ものの見方」に着想を得た新しい画像認識アルゴリズムが開発された。
人間が1枚の写真を見て被写体を特定できるのは、認識可能な特徴のコレクションを持っているからだ。たとえば鳥であれば、くちばしの輪郭、羽毛の色、足の形などによって種類を見分けることができる。だが、ニューラル・ネットワークは、鳥と背景を区別せず、単に画像全体のピクセル・パターンを検索する。このため、ミスに対して脆弱であり、人間がそのミスの原因を究明するのは難しい。
デューク大学とマサチューセッツ工科大学(MIT)リンカーン研究所の研究者は、鳥種を見分ける特徴を認識するために、ニューラル・ネットワークを訓練した。それぞれの鳥種の多くのサンプルを与え、同じ鳥種内では似ているが鳥種間 では異なる部分を画像から探すことで特徴を認識させた。このプロセスを通じて、ニューラル・ネットワークは、たとえばコウカンチョウを見分ける特徴は赤い羽に対する黒いマスクであり、フロリダカケスは青い羽と白い体である、といったことを学習する可能性がある。鳥の新しい画像が表示されると、アルゴリズムは認識可能な特徴を検索し、どの鳥種に属しているかを予測する。累積された証拠を利用して最終決定を下すのだ。
たとえばシマセゲラの写真の場合、アルゴリズムは訓練された認識可能な特徴を2つ見つける。羽毛の白黒のパターンと頭の赤い色だ。前者の羽毛の特徴は、可能性のある2種類の鳥種と一致するだろう。シマセゲラまたはホオジロシマアカゲラだ。しかし、後者の頭の色の特徴はシマセゲラと極めてよく一致する。
2つの証拠から、アルゴリズムはシマセゲラの可能性が高いと判断する。次に、探し出した特徴の写真を表示して、人間にその決定に至った経緯を説明する。
画像認識アルゴリズムが病院など高リスク環境でより有用に活用されるためには、その結論に至った経緯を人間が理解できる方法で説明する必要がある。たとえば、医師が腫瘍の種類を見分けるのに使う場合がそうだ。もちろん、人間がアルゴリズムを信頼できるようになるためにも重要だが、ロジックの誤りを人間がより容易に特定するためにも役立つ。
テストを通じて研究者が実証したのは、この解釈性をアルゴリズムに組み込んでも、精度が損なわれないということだ。今回の研究チームの手法を鳥種の識別タスクと車のモデルの識別タスクで試したところ、どちらも人間が解釈できないアルゴリズムによって識別される最新の結果とほぼ同じ、場合によってはそれを上回ることが分かった。