KADOKAWA Technology Review
×

ニューズラインエマージング・テクノロジーの最新情報をお届け。

少ない訓練でCAPTCHAを突破、機械学習の新手法 This AI Technique Was Kept Quiet so Spammers Wouldn’t Misuse It

少ない訓練でCAPTCHAを突破、機械学習の新手法

人間の脳にヒントを得た新たなコンピュータービジョン・アルゴリズムが、AIの地位を向上させる役に立つかもしれない。だが、あなたの受信トレイはスパムメールでいっぱいになる可能性もある。

イーロン・マスクやマーク・ザッカーバーグが後押しするスタートアップ企業、ヴァイケアリアス(Vicarious)は、神経科学にヒントを得た新しいタイプの機械学習について詳細を公表した。画像の一部が遮られていたり、変形していたりしても混乱せずに、コンピューターに視覚情報をもっと効率的かつ人間らしく認識させようというものだ。

1億5000万ドル以上の資金を調達したヴァイケアリアスは、もう何年も画像認識テクノロジーについて話してきたが、詳細を公にしたのはこれが初めてだ(「Inside Vicarious, the Secretive AI Startup Bringing Imagination to Computers)参照」。10月28日にサイエンス誌で発表されたレポートで、ヴァイケアリアスの研究チームは、自社のアプローチが、キャプチャ(CAPTCHA、ボットが電子メールアカウントを機械的に登録することを防ぐために使われる、くねくねと曲がったテキスト)を突破できることを明らかにした。

「明らかにWebの安全性が関わってくるため、詳細の公表については注意したほうがよいと私たちは判断しました」とヴァイケアリアスの共同創業者で、技術トップを務めるディリープ・ジョージは言う。ジョージによれば、ほとんどの大企業はすでにテキストベースのキャプチャを使わなくなっており、潜在的なスパマーに悪用されることはないだろうとのことだ。

近年、多層ニューラルネットワークを使うことで、コンピューターによる画像認識に大きな前進が見られた。多層ニューラルネットワークは、「犬」や「猫」といった高度な概念を識別する学習ができるが、莫大な量の学習データが必要で、未知の物体の前ではすぐに混乱してしまう。

ヴァイケアリアスは、最初に学習したもの以外のものも一般化できる「再帰的皮質ネットワーク(RCN)」と名付けた技術を開発した。神経科学からヒントを得たRCNは、縁や曲線のような画像情報に関する前提データを符号化して、訓練では遭遇しなかった情報を認識する。つまり、歪んだAという文字を見ても、それが何らかの主要な視覚的特徴を残していれば認識できる。

RCNは、マサチューセッツ工科大学やカーネギーメロン大学、ニューヨーク大学の研究グループが用いている、コンピューターにたった一つか二つの例を見せただけで、手書き文字を認識させる技術に似ている(「This AI Algorithm Learns Simple Tasks as Fast as We Do」参照)。

ジョージは、ヴァイケアリアスが開発したテクノロジーを、ロボットがもっと能率的に学習するために役立つできるだろうと述べている。「私たちはロボット工学におけるいくつかの課題に取り組んでいます。データ効率と推論は、ロボットが型にはまらない状況に対処する場合にとても重要です」。

ウィル ナイト [Will Knight] 2017.11.07, 18:08
MITテクノロジーレビューは有料会員制サイトです
有料会員になると、毎月150本以上更新されるオリジナル記事が読み放題!
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る