映像に合ったリアルな音を機械学習で生成、アドビらが開発
ノースカロライナ大学チャペルヒル校とアドビの研究者が、映像に映った物体に合わせた音を生成するアルゴリズムを開発した。音声編集の自動化へ向けた道を切り開く興味深い研究だ。 by Emerging Technology from the arXiv2018.01.30
機械学習は、画像と画像を作る方法に関する考え方を変えつつある。研究者は顔を作成したり、漫画を描いたり、写真を絵画風に加工する方法を機械に学習させてきた。こうした方法をもう少し進化させれば、映像も生成できるはずだし、実際にそれは現実になりつつある。
映像を生成するということは、完全なバーチャル環境を機械によって作り出すことを指している。これが実現できれば、人間が経験する未来に対する、あらゆる可能性が開かれる。
だがそこには1つの問題がある。映像はただの視覚的体験だけではない。本物のような音声を生成することも、映像を生成するのと同様に重要だ。つまり、興味深い疑問点は、機械が映像の音声部分を本物らしく生成できるかどうかということだ。
ノースカロライナ大学チャペルヒル校のイーピン・シュウらとアドビ・リサーチの研究者の功績により、この疑問に対する答えが出た。研究チームは、短いビデオ・クリップに本物のようなサウンドトラックを付ける方法を機械学習アルゴリズムに学習させた。
実際に、機械が作り出す音声は、ほとんどの人間が本物だと勘違いするほどリアリティにあふれている。この動画の音を聞いて、本物の音と生成した音との違いを聞き分けてみてほしい。
研究チームは、機械学習の標準的な手法を採用している。アルゴリズムの優劣は訓練するために使 …
- 人気の記事ランキング
-
- A new sodium metal fuel cell could help clean up transportation MITがナトリウム燃料電池を開発、エネルギー密度はリチウムの4倍
- A new atomic clock in space could help us measure elevations on Earth 誤差1センチ以内へ、宇宙原子時計で描く新たな地球像
- Anthropic’s new hybrid AI model can work on tasks autonomously for hours at a time アンソロピックが「Claude 4」発表、数時間の自律作業可能に
- How AI is introducing errors into courtrooms AI幻覚、法廷にも 知的労働の最高峰がなぜ騙されるのか?