KADOKAWA Technology Review
×
機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も
Ms. Tech | Getty images
ニュース 無料会員限定
This AI lets you deepfake your voice to speak like Barack Obama

機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も

機械学習の手法を使うことで、自分の声を、あらゆる年齢やジェンダーの声にリアルタイムで変換できるテクノロジーが開発された。訓練用の音声データさえあれば誰の声でも模倣することが可能で、声による「なりすまし」に悪用される可能性もある。 by Will Knight2019.03.19

これが私のもう1人の自分、ケイティだ。

しゃべり声のアクセントや感情、抑揚はすべて私のものだ。だが、声の高い若い女性のように聞こえる。

私の女性的な「ボイス・スキン」を作ったのは、マサチューセッツ州ケンブリッジにあるモデュレート・ドットAI(Modulate.ai)という企業だ。同社は機械学習を用いた強力な新種の手法によって、声の特徴をコピーして、モデリングし、操作することを可能にした。

このテクノロジーは、カイロ・レン(スター・ウォーズの登場人物)のような声で話せるようにする単純な音声フィルターを遥かに超えるものだ。この手法を使えば、あらゆる年齢、ジェンダー、声のトーンなどをすべて、リアルタイムで装うことが可能になる。有名人の声を模倣することもできる。その気になれば、私はケイティになりすまして電話で長々と話すこともできるのだ。

私はモデュレートの本社を訪れ、同社のテクノロジーや目標について聞き、人工知能(AI)を使って他人の声を模倣することの倫理的影響について話した。防音ブースに入った私は、同社のボイス・スキンをいくつか試してみた。

これが私の実際の声だ。

そしてこちらが別の人格の声だ。

2つの人格の間を、リアルタイムで行き来することもできる。

このボイスモデリング・テクノロジーは完璧ではない。作られた声には若干の震えがある。だが非常に質が高く、音声データを与えていくとさらに改善される。このことは、機械学習の発展がいかにデジタル・リアリティを急速に変化させ始めているかを示している。モデュレートは敵対的生成ネットワーク(GANs)を用いて、音声信号のオーディオ特性のキャプチャーとモデリン …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. Inside the tedious effort to tally AI’s energy appetite 動画生成は別次元、思ったより深刻だったAIの電力問題
  2. Promotion Call for entries for Innovators Under 35 Japan 2025 「Innovators Under 35 Japan」2025年度候補者募集のお知らせ
  3. IBM aims to build the world’s first large-scale, error-corrected quantum computer by 2028 IBM、世界初の大規模誤り訂正量子コンピューター 28年実現へ
  4. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る