KADOKAWA Technology Review
×
6/15開催 「生成AI革命2」参加受付中【会員優待あり】
「あなたの声」のまま変換、グーグルの新しい翻訳システム
EMILIO MORENATTI/AP
Google’s AI can now translate your speech while keeping your voice

「あなたの声」のまま変換、グーグルの新しい翻訳システム

グーグルが、ある言語で入力した音声を、話者の声の特徴を保ったまま別の言語の音声で出力する自動翻訳システムを開発した。ある言語での話者の「声紋」を別の言語にマッピングするように訓練したニューラルネットワークを利用する。 by Karen Hao2019.05.22

このスペイン語の音声クリップを聞いてみよう。

この音声クリップを従来の自動翻訳システムで英語に翻訳すると、次のようになる。

そしてこちらが、グーグルの新しい自動翻訳システムを利用した場合のものである。

完璧ではないものの、グーグルの翻訳システムでは、元の話者の声と口調がある程度維持されていることがわかる。グーグルの翻訳システムは、音声入力を音声出力に直接変換しているからだ。その間に他のステップはない。それに対して従来の翻訳システムは、音声を一旦テキストに変換し、そのテキストを翻訳した後、再度音声を合成している。そのため、その過程で元の声の特徴が失われてしまう。

トランスラトトロン(Translatotron)」と名付けられたこの新しいシステムには3つのコンポーネントがあり、そのすべてが、話者の音声スペクトログラムを調べている。音声スペクトログラムとは、再生されている音の周波数分布のスナップショットを視覚化したもので、一般的に声紋と呼ばれる。トランスラトトロンの最初のコンポーネントでは、入力言語の声紋を出力言語の声紋にマッピングするように訓練したニューラル・ネットワークを使用する。2つめのコンポーネントは、マッピングした声紋を、再生可能な音声の波形に変換する。その後、3つめのコンポーネントが、元の話者の声の特徴を、最終的な音声出力に被せて戻す。

このアプローチによって、言葉には表されない重要な情報が維持され、より繊細な表現の翻訳が可能になるだけでなく、理論的には、翻訳ミスが最小限に抑えられる。ステップがより少なくなるからだ。

トランスラトトロンは現在、研究者らが概念実証をしている段階だ。テストでは、精選された訓練用データがすでに大量に確保されているスペイン語から英語への翻訳だけを試みている。だが、上の音声クリップを聞くと、いずれは商用システムとして実用化される可能性がありそうだ。その他の音声クリップはこちらから確認できる。

人気の記事ランキング
  1. MITTR Emerging Technology Nite #23 Plus MITTR主催「生成AI革命2」開催(オンライン&東京)のご案内
  2. This abundant material could unlock cheaper batteries for EVs 中国企業が続々発表、ナトリウムイオンはEV電池の主流になるか?
  3. A chatbot that asks questions could help you spot when it makes no sense チャットGPT、「質問付き」回答で騙される人が減ることが判明
カーレン・ハオ [Karen Hao]米国版 AI担当記者
MITテクノロジーレビューの人工知能(AI)担当記者。特に、AIの倫理と社会的影響、社会貢献活動への応用といった領域についてカバーしています。AIに関する最新のニュースと研究内容を厳選して紹介する米国版ニュースレター「アルゴリズム(Algorithm)」の執筆も担当。グーグルX(Google X)からスピンアウトしたスタートアップ企業でのアプリケーション・エンジニア、クオーツ(Quartz)での記者/データ・サイエンティストの経験を経て、MITテクノロジーレビューに入社しました。
生成AI革命

自然な文章を生成するチャットGPT(ChatGPT)/GPT-4などの大規模言語モデル、テキストから画像を生成できるDALL·E 、Stable Diffusion、Midjourneyなどの拡散モデルの登場は、私たちの生活やビジネスを大きく変えようとしている。
人工知能(AI)の新時代を牽引する「生成AI(ジェネレーティブAI)」革命の最前線を追う。

記事一覧を見る
人気の記事ランキング
  1. MITTR Emerging Technology Nite #23 Plus MITTR主催「生成AI革命2」開催(オンライン&東京)のご案内
  2. This abundant material could unlock cheaper batteries for EVs 中国企業が続々発表、ナトリウムイオンはEV電池の主流になるか?
  3. A chatbot that asks questions could help you spot when it makes no sense チャットGPT、「質問付き」回答で騙される人が減ることが判明
MITテクノロジーレビュー[日本版] Vol.10
MITテクノロジーレビュー[日本版] Vol.10世界を変えるU35イノベーター2022年版

人工知能(AI)/ロボット工学、インターネット、通信、コンピューター/電子機器、輸送、持続可能性、生物工学など幅広いテクノロジー領域で活躍する2022年の日本を代表する若手イノベーター14人、米国・中国・欧州などで活躍するグローバルのイノベーター35人を一挙紹介する。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る