ロボット工学

Google’s New Service Translates Languages Almost as Well as Humans Can グーグル翻訳が一部言語で
人間並みの精度を実現

飛躍的に流ちょうな翻訳能力を達成したグーグルのソフトウェアにより、チャットボットはようやく使い物になる。 by Tom Simonite2016.09.28

グーグルが機械学習で達成した最新の進歩は、世界の人々の距離を少し縮めてくれるかもしれない。

グーグルの研究者が、従来よりも大幅に精度の高い翻訳システムを開発して以降、グーグルは自社の翻訳サービスを改良しつづけている。新ソフトは、人間の翻訳者に対して、一部の言語の組み合わせ(英語からスペイン語、英語からポルトガル語への翻訳)では、人間による翻訳文の滑らかさに、ほぼ匹敵するところまで到達した。

グーグルはこの新システムを、中国語から英語への翻訳ですでに公開している(その進歩が分かる例はこちら)。グーグルは、現在の翻訳システムを、全面的に新システムに移行させようとしている。

言語の壁を越えて、Webページの閲覧やメッセージを交換することが今より簡単になれば、世界中の人々がお互いにコミュニケーションをとりやすくなるかもしれない。グーグルの研究者、クォック・リーは、グーグル翻訳の大規模アップグレードが、人間と機械の間の関係向上にもつながりうるという。

A man uses Google's translation app in Paris in 2014.

2014年、パリでグーグルの翻訳アプリを使う男性

グーグルの新翻訳システムで使われている発想は、ソフトウェアが今よりも難しい物事(たとえば、ウィキペディアを読むこと)を学習するのに役立ち、さらに、世界に関する複雑な疑問を解くことにもつながるのではないかとリーはいう(リーは、MIT Technology Reviewが選んだ、2014年版35歳未満のイノベーター35人の1人だ)。

グーグルの新翻訳システムは、深層学習と呼ばれる手法で構築された。深層学習では、哺乳類の脳の研究から大まかなヒントを得た、数学的関数のネットワークを使う(「2013年ブレイクスルーとなったテクノロジー10選:深層学習」参照)。深層学習は、画像・音声認識などの分野における著しい進歩を生み、人工知能に対する近年の大規模投資の引き金となった。

2014年から、グーグルの研究者は、深層学習を使って翻訳の精度を飛躍的に向上させる方法について研究を続けている。リーによれば、最新の研究結果は、今やその時代が訪れたことを示しているという。

27日に発表された論文では、英語からスペイン語、フランス語、ポルトガル語、中国語への翻訳文と、これらの言語から英語への翻訳文に基づく調査結果が紹介されている。2つの言語に堪能な人々に、グーグルの新システムによる翻訳結果と、人間の翻訳者による翻訳結果を比較させると、場合によっては、回答者は両者の違いをさほど大きく感じなかった。

調査に参加した人々は、ウィキペディアやニュース記事からランダムに選ばれた500の翻訳文について、0 から6の点数で評価した。英語からスペイン語への翻訳では、グーグルの新システムの平均点は5.43で、人間の翻訳者の平均点、5.55との間に大差はなかった。また、グーグルの新システムは、ポルトガル語から英語、フランス語から英語の翻訳でも、人間の翻訳者と近い点数をとった。

グーグルの古いシステムは、人間の能力に迫るほどではなかった。グーグルの試験では、人間の回答者たちが、新システムが旧システムよりも64%から87%優れていると評価した。リーによれば、この堂々たる結果は、新システムの開発方針によるものだ。グーグルの研究者は、ニューラルネットワークを元にしたシステムを作る上で、旧システムよりも、人間の設計者からの独立度がずっと大きくなるようにした。

新旧のシステムは、いずれも、異なる言語に翻訳された多数の文書を調べることで、翻訳の方法を学習する。ただし、旧システムは、文章を翻訳するために、ある特定の手順(レシピ)を使うように設計されていた。旧システムには、特定の物事(たとえば、別の言語の中で、文の中の語をどのように並び替えるか)を学習するために作られた、専用の構成要素がいくつかあった。

グーグルの新システムには、特定のレシピは与えられていない。文章をある言語から別の言語に変換する上で、システムは自らそのやり方を見つけ出し、信頼できる翻訳文を作る。さらに、新システムは、自ら文章を読み、作成することさえできる。その際、システムは、個々の語が示す概念を気にかけることはない。代わりにシステムは、文章を小さな断片に分解する。生まれる断片は無意味に見えるものが多く、その大部分は、文章を読み上げる際の発音の区切りとも一致しない。

この独立性ゆえに、翻訳中にシステムが何を行っているかを理解するのは、システムの開発者たちにさえ難しい。しかし、できあがった翻訳文は、説明なしでも分かりやすく読める、とリーはいう。

「(傍目には何をしているかが分からず)落ち着かないかもしれませんが、このシステムは、私たちがたくさんの場所で試験してきたものですし、うまく働くんです」

グーグルが翻訳に導入した起爆剤は、無から突然に現れたものではない。学術機関や産業界の研究者は、リノイ大学のレーン・シュワルツ准教授(言語学)は、近年「ニューラルネットワークにより、ソフトウェアに言語を理解させる試みにおいて、新たな進歩が実現するだろう」と確信するに至ったという。

本当に言語を理解する能力を、多少なりとも示すソフトウェアを作り出す。この目標に向けて、リーがどの程度の進歩を見込んでいるのかは不明だ。人間のコミュニケーション方法が持つ複雑さと強力さをまねることが、数十年にわたり、人工知能研究者たちの目標になっていた。しかし、その成功例は、これまでのところ乏しい(「人工知能と言語」参照)。

人気の記事ランキング
  1. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  2. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  3. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  4. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持
この記事をシェアしてください!
この記事が気に入ったら
いいね!しよう
トム サイモナイト [Tom Simonite]米国版 サンフランシスコ支局長
MIT Technology Reviewのサンフランシスコ支局長。アルゴリズムやインターネット、人間とコンピューターのインタラクションまで、ポテトチップスを頬ばりながら楽しんでいます。主に取材するのはシリコンバレー発の新しい考え方で、巨大なテック企業でもスタートアップでも大学の研究でも、どこで生まれたかは関係ありません。イギリスの小さな古い町生まれで、ケンブリッジ大学を卒業後、インペリアルカレッジロンドンを経て、ニュー・サイエンティスト誌でテクノロジーニュースの執筆と編集に5年間関わたった後、アメリカの西海岸にたどり着きました。
「未来の機械」の記事
人気の記事ランキング
  1. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  2. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  3. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  4. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持