KADOKAWA Technology Review
×
知性を宿す機械 Insider Online限定
AI knows how a video should sound

映像に合ったリアルな音を機械学習で生成、アドビらが開発

ノースカロライナ大学チャペルヒル校とアドビの研究者が、映像に映った物体に合わせた音を生成するアルゴリズムを開発した。音声編集の自動化へ向けた道を切り開く興味深い研究だ。 by Emerging Technology from the arXiv2018.01.30

機械学習は、画像と画像を作る方法に関する考え方を変えつつある。研究者は顔を作成したり、漫画を描いたり、写真を絵画風に加工する方法を機械に学習させてきた。こうした方法をもう少し進化させれば、映像も生成できるはずだし、実際にそれは現実になりつつある。

映像を生成するということは、完全なバーチャル環境を機械によって作り出すことを指している。これが実現できれば、人間が経験する未来に対する、あらゆる可能性が開かれる。

だがそこには1つの問題がある。映像はただの視覚的体験だけではない。本物のような音声を生成することも、映像を生成するのと同様に重要だ。つまり、興味深い疑問点は、機械が映像の音声部分を本物らしく生成できるかどうかということだ。

ノースカロライナ大学チャペルヒル校のイーピン・シュウらとアドビ・リサーチの研究者の功績により、この疑問に対する答えが出た。研究チームは、短いビデオ・クリップに本物のようなサウンドトラックを付ける方法を機械学習アルゴリズムに学習させた。

実際に、機械が作り出す音声は、ほとんどの人間が本物だと勘違いするほどリアリティにあふれている。この動画の音を聞いて、本物の音と生成した音との違いを聞き分けてみてほしい。

研究チームは、機械学習の標準的な手法を採用している。アルゴリズムの優劣は訓練するために使 …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
MITテクノロジーレビュー[日本版] Vol.5
MITテクノロジーレビュー[日本版] Vol.5Cities Issue

新型コロナのパンデミックによって激変した都市生活は、ポストコロナでどう変わるのか? 都市部への人口集中が世界で加速する中、環境、災害、貧困といった負の側面をテクノロジーは解決できるのか? 多様な人々が集まり、化学反応が起きるイノベーションの集積地としての役割を都市は今後も果たし続けるのか? 世界の豊富な事例と識者への取材を通して、新しい都市の未来像を描く。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る