KADOKAWA Technology Review
×
Innovators Under 35 Japan 2026 候補者募集開始!
深層学習で映像からモノラル音を立体化、「2.5D音響」の新手法
Samuel Dixon | Unsplash
ニュース Insider Online限定
Deep learning turns mono recordings into immersive sound

深層学習で映像からモノラル音を立体化、「2.5D音響」の新手法

立体視できる3D画像は何十年も前から身近な存在だが、リアルな3D音響の生成は難しく、研究者たちは苦労を重ねて来た。ここに来てついにテキサス大学の研究チームが、機械学習アルゴリズムを用いて、映像を観ることでモノラル音から3Dに近い「2.5D」音響を生成できるシステムを開発した。 by Emerging Technology from the arXiv2019.02.25

近くの木で鳥のさえずりが聞こえたら、目で探さなくても比較的すぐに、その鳥のおおよその場所がわかる。道を渡るときに車のエンジン音が聞こえたら、大抵の場合、後ろに車が迫っているかどうかも直ちに分かるはずだ。

人間には、3次元(3D)空間内で音源の場所を特定する優れた能力がある。我々の耳が非対称にできており、右と左の耳が一定の距離だけ離れていることがその理由であることはよく知られている。

人間の目を簡単に欺く3D画像を作成する方法はすでに知られている。しかし、人間の聴覚を欺けるほど優れた人工の3D音響を作る方法はまだ見つかっていない。

現在、テキサス大学オースティン校のルオハン・ガオとフェイスブック研究所のクリスティン・グラウマン博士の研究により、状況は少し変わってきたようだ。グラウマン博士らは、人工知能(AI)システムを使って、普通のモノラル音を3Dにかなり近い立体的な音響に変換させる方法を開発しており、これを2.5D音響と呼んでいる。

背景となる知識を少し説明しておこう。脳は、3D空間のどこから音が来ているかを理解するためにさまざまな手がかりを使う。それぞれの耳に音が届く時間差(両耳間時差)は、大切な手掛かりの1つだ。

左側で出された音は、右耳よりも左耳のほうに先に届く。この時間差を我々が意識することはないが、脳はこの情報を使って、音がどこから来るのかを決める。

もう1つの手がかりは、音量の違いだ。左耳に聞こえる音量の方が右耳よりも大きければ、脳は音が左側から来ていると判断する。これを両耳間音圧差と呼ぶ。

これらの差は、左耳と右耳がどれだけ離れているかに依存している。ステレオで録音をしても、2つのマイクの間の距離が両耳の間の距離と一致しないため、この効果は再現されない。

また、音と耳介(耳の外側にはみ出している部分)との相互作用も重要だ。耳介は、音が届いた方向に応じて、その音を歪ませる性質がある。たとえば、前方からの音は耳介に届く前に外耳道に達するが、後方からの音は逆に、外耳道に達する前に耳介に …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. It’s time to address the looming crisis in entry-level work. 「コーディングを学べ」もう通用せず、AIが若者の雇用を奪い始めた
  2. Promotion Call for entries for Innovators Under 35 Japan 2026 「Innovators Under 35 Japan」2026年度候補者募集のお知らせ
  3. Anthropic’s Code with Claude showed off coding’s future—whether you like it or not 「Claudeに任せてしまおう」 たった1年で激変したソフトウェア開発
▼Promotion
社会実装都市「ひろしま」の魅力に迫る ローカル ✕ イノベーション
MITテクノロジーレビューが選んだ、AIの10大潮流 [2026年版]

AIをめぐる喧騒の中で、本当に目を向けるべきものは何か。この問いに対する答えとして、MITテクノロジーレビューはAIの重要なアイデア、潮流、新たな進展を整理したリストを発表する。

特集ページへ
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る