KADOKAWA Technology Review
×
2024年を代表する若きイノベーターたちに会える!【11/20】は東京・日本橋のIU35 Japan Summitへ
資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題
Stephanie Arnett/MIT Technology Review | rawpixel, envato
人工知能(AI) 無料会員限定
People are using Google study software to make AI podcasts—and they’re weird and amazing

資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題

グーグルの新機能「オーディオ・オーバービュー(Audio Overview)」がネット上で意外な人気を集めている。テキストや動画をアップロードするだけで、AIが自動的にポッドキャストを生成。人間らしい会話と豊かな表現力で内容を解説する。その活用例をいくつか紹介しよう。   by Melissa Heikkilä2024.10.08

「さて、今日は最先端のテクノロジーを詳しく掘り下げていくとしよう」。砕けた調子の米国人男性の声がする。ただし、この声を発しているのは人間ではない。声の源は、「オーディオ・オーバービュー(Audio Overview)」というグーグルの新しい人工知能(AI)ポッドキャストツールだ。このツールが予想外のバイラルヒットとなっている。

Audio Overviewは、およそ1年前にリリースされたAIリサーチ・アシスタント「ノートブックLM(NotebookLM)」の一部として、今年9月中旬に提供が始まった。グーグルの「ジェミニ(Gemini) 1.5」モデルを搭載したNotebookLMは、ユーザーがリンクや動画、PDFファイル、テキストなどのコンテンツをアップロードして関連する質問を投げると、それに回答。コンテンツの短い要約も提供する。

このツールは、「ディープダイブ(Deep Dive)」と呼ばれるポッドキャストを生成する。アップロードした内容について、男性と女性の声で議論するのだ。その声は息をのむほどリアルだ。エピソードには、「おや」「わぁ」「ええ」「ちょっと待って、ちゃんと理解させて」 といった、人間らしく聞こえる語句が散りばめられている。 「ホスト」たちは、お互いの発言を遮ることさえある。

この機能をテストするため、私はMIT テクノロジーレビュー(米国版)の創刊125周年記念号からすべての記事をNotebookLMにコピーし、それを元に10分間のポッドキャストを生成するよう求めた。すると、NotebookLMは注目する記事をいくつか選び出し、ホスト役のAIが記事の要点を見事に伝えてくれた。ぜひ聴いてみてほしい。

MIT テクノロジーレビュー創刊125周年記念号

NotebookLMのプロダクトリーダーを務めるライザ・マーティンは、X(旧ツイッター)で、このAIシステムは、「ほんの少しのコンテンツと引き換えに魔法を創り出す」 ように設計されていると語ってている。音声モデルは、感情的で人を惹きつける音声を生み出すように意図されており、「明るく、強い関心を示す口調」でそれを表現しているとマーティンは言う。

もともと学習用ツールとして登場したNotebookLMは、ユーザーたちの間で独自の使い方をされている。マーティンによると、グーグルは現在、長さ、形式、音声、言語の変更など、多くのカスタマイズ・オプションの開発に取り組んでいるという。今のところ、ポッドキャストは英語でのみ生成可能となっているが、レディット(Reddit)ではフランス語とハンガリー語でのオーディオ作成に成功した例も紹介されている。

確かにクールな機能だ。胸が躍るような、と表現することもできるかもしれない。とはいえ、生成AIを悩ませる幻覚(ハルシネーション)やバイアスなどの問題と無縁というわけではない。

NotebookLMのこれまでの主な活用例をいくつか紹介しよう。

オンデマンド型ポッドキャスト

オープンAI(OpenAI)の創業メンバーの一人で、かつてテスラのAI部長を務めたアンドレイ・カルパシーは、Deep Diveが現在のお気に入りポッドキャストであるとXで述べている。カルパシーは、『Histories of Mysteries(ミステリーの歴史)』という独自のAIポッドキャスト・シリーズを作成した。狙いは、「歴史上最も興味深い謎を明らかにする」 …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. How ChatGPT search paves the way for AI agents 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略
  2. Promotion The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、
    日本発U35イノベーター
    2024年版
  3. The US is about to make a sharp turn on climate policy トランプ再選、気候対策に打撃 今後予測される影響は?
  4. OpenAI brings a new web search tool to ChatGPT チャットGPTに生成AI検索、グーグルの牙城崩せるか
  5. AI will add to the e-waste problem. Here’s what we can do about it. 30年までに最大500万トン、生成AIブームで大量の電子廃棄物
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る