KADOKAWA Technology Review
×
機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も
Ms. Tech | Getty images
ニュース 無料会員限定
This AI lets you deepfake your voice to speak like Barack Obama

機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も

機械学習の手法を使うことで、自分の声を、あらゆる年齢やジェンダーの声にリアルタイムで変換できるテクノロジーが開発された。訓練用の音声データさえあれば誰の声でも模倣することが可能で、声による「なりすまし」に悪用される可能性もある。 by Will Knight2019.03.19

これが私のもう1人の自分、ケイティだ。

しゃべり声のアクセントや感情、抑揚はすべて私のものだ。だが、声の高い若い女性のように聞こえる。

私の女性的な「ボイス・スキン」を作ったのは、マサチューセッツ州ケンブリッジにあるモデュレート・ドットAI(Modulate.ai)という企業だ。同社は機械学習を用いた強力な新種の手法によって、声の特徴をコピーして、モデリングし、操作することを可能にした。

このテクノロジーは、カイロ・レン(スター・ウォーズの登場人物)のような声で話せるようにする単純な音声フィルターを遥かに超えるものだ。この手法を使えば、あらゆる年齢、ジェンダー、声のトーンなどをすべて、リアルタイムで装うことが可能になる。有名人の声を模倣することもできる。その気になれば、私はケイティになりすまして電話で長々と話すこともできるのだ。

私はモデュレートの本社を訪れ、同社のテクノロジーや目標について聞き、人工知能(AI)を使って他人の声を模倣することの倫理的影響について話した。防音ブースに入った私は、同社のボイス・スキンをいくつか試してみた。

これが私の実際の声だ。

そしてこちらが別の人格の声だ。

2つの人格の間を、リアルタイムで行き来することもできる。

このボイスモデリング・テクノロジーは完璧ではない。作られた声には若干の震えがある。だが非常に質が高く、音声データを与えていくとさらに改善される。このことは、機械学習の発展がいかにデジタル・リアリティを急速に変化させ始めているかを示している。モデュレートは敵対的生成ネットワーク(GANs)を用いて、音声信号のオーディオ特性のキャプチャーとモデリン …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
【春割】実施中! ひと月あたり1,000円で読み放題
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る