映像に合ったリアルな音を機械学習で生成、アドビらが開発
ノースカロライナ大学チャペルヒル校とアドビの研究者が、映像に映った物体に合わせた音を生成するアルゴリズムを開発した。音声編集の自動化へ向けた道を切り開く興味深い研究だ。 by Emerging Technology from the arXiv2018.01.30
機械学習は、画像と画像を作る方法に関する考え方を変えつつある。研究者は顔を作成したり、漫画を描いたり、写真を絵画風に加工する方法を機械に学習させてきた。こうした方法をもう少し進化させれば、映像も生成できるはずだし、実際にそれは現実になりつつある。
映像を生成するということは、完全なバーチャル環境を機械によって作り出すことを指している。これが実現できれば、人間が経験する未来に対する、あらゆる可能性が開かれる。
だがそこには1つの問題がある。映像はただの視覚的体験だけではない。本物のような音声を生成することも、映像を生成するのと同様に重要だ。つまり、興味深い疑問点は、機械が映像の音声部分を本物らしく生成できるかどうかということだ。
ノースカロライナ大学チャペルヒル校のイーピン・シュウらとアドビ・リサーチの研究者の功績により、この疑問に対する答えが出た。研究チームは、短いビデオ・クリップに本物のようなサウンドトラックを付ける方法を機械学習アルゴリズムに学習させた。
実際に、機械が作り出す音声は、ほとんどの人間が本物だと勘違いするほどリアリティにあふれている。この動画の音を聞いて、本物の音と生成した音との違いを聞き分けてみてほしい。
研究チームは、機械学習の標準的な手法を採用している。アルゴリズムの優劣は訓練するために使 …
- 人気の記事ランキング
-
- What a massive thermal battery means for energy storage 1000℃のレンガで熱貯蔵、世界最大の蓄熱電池が稼働
- Promotion MITTR Emerging Technology Nite #35 Soraの問題点とは? AI時代の知財を考える11/12緊急イベント
- I tried OpenAI’s new Atlas browser but I still don’t know what it’s for 誰のためのブラウザー? オープンAI「Atlas」が残念な理由
- An AI adoption riddle AIの試験運用は失敗続き、それでもなぜ投資をやめないのか?
- This startup is about to conduct the biggest real-world test of aluminum as a zero-carbon fuel アルミ缶をクリーン燃料に、 米スタートアップが作った 「新エンジン」を訪ねた
