KADOKAWA Technology Review
×
自然な会話ができるチャットGPT新機能、一般開放を開始
Stephanie Arnett / MIT Technology Review | Adobe Stock
OpenAI has released a new ChatGPT bot that you can talk to

自然な会話ができるチャットGPT新機能、一般開放を開始

オープンAIは一部ユーザーに対し、自然で流ちょうな会話ができるチャットGPTの新機能の提供を開始した。GPT-4oモデルを使用することで、声のトーンの違いを聞き分け、中断にも対応し、問い合わせにリアルタイムで答えられる。 by Melissa Heikkilä2024.08.01

この記事の3つのポイント
  1. オープンAIが音声で会話できる高度なAIチャットボットの提供を開始した
  2. 一部ユーザーは7月30日から使用可能で、秋までに全ユーザーに展開する
  3. 将来的にさらに高度な機能を搭載しAIアシスタントの能力を高めていく計画
summarized by Claude 3

オープンAI(OpenAI)は、音声で会話できる高度な人工知能(AI)チャットボットの提供を開始した。一部ユーザーは7月30日から使用可能だ。

この新しいチャットボットは、オープンAIが推進する新世代のAI搭載音声アシスタントを象徴するものだ。音声アシスタントはアップルのシリ(Siri)やアマゾンのアレクサ(Alexa)の流れを汲むものだが、それらよりもはるかに自然で流暢な会話ができるのが特徴。現状よりも有能なAIエージェントに向けた一歩と言える。新しい「チャットGPT(ChatGPT)」音声ボットは、さまざまな声のトーンの違いを聞き分け、中断にも対応し、問い合わせにリアルタイムで答えられる。また、より自然な発話になるように訓練されており、感情によって声を使い分ける。

この音声モードには、音声、テキスト、ビジョン機能を組み合わせたオープンAIの新しいGPT-4oモデルが使われている。フィードバックを集めるため、まずは有料版のチャットGPTプラス(ChatGPT Plus)の利用者のうち「少数のユーザー」を対象に音声チャットボットをリリースするが、今秋までにチャットGPTプラスの全ユーザーに提供する予定だという。チャットGPTプラスは月額20ドルで利用できる。オープンAIは、新たなチャットGPTボットの初回リリースの対象者に通知し、新モデルの使い方を説明するとしている。

5月に告知されていた今回の新たな音声機能は、当初の予定より1カ月遅れてリリースされることになった。オープンAIによれば、望ましくないコンテンツを検知して拒否するなど、安全性確保のための機能の改善にまだ時間が必要だという。また同社は、数百万のユーザーがリアルタイムで応答を受けられるようにするためのインフラを準備中だと説明した。

オープンAIは、モデルに欠陥がないかを徹底的に調べる100人超の外部レッドチームとともに、モデルの音声機能をテストしたと述べている。同社によると、29カ国から45言語のテスターが関わったという。

また、モデルには安全性確保の対策を講じているとしている。たとえば、モデルを使って音声のディープフェイクが作られるのを防ぐため、声優に協力を仰いで4種のプリセット音声を用意した。GPT-4oが、それ以外の人間の声を真似たり生成したりすることはない。

オープンAIはGPT-4oを最初に公開した際、俳優のスカーレット・ヨハンソンの声によく似た音声「スカイ(Sky)」の使用をめぐって反発を買った。ヨハンソンは声明の中で、オープンAIがヨハンソンの声をモデルに使う許可を求めてきたが、断ったと説明した。ヨハンソンは、自分の声に「ゾッとするほど似ている」モデルのデモの音声を聞いてショックを受けたという。オープンAIは、ヨハンソンの声は使用していないとしているが、スカイは現在利用できないようになっている。

オープンAIはまた、著作権侵害の疑いで複数の訴訟にも巻き込まれている。同社は、音楽をはじめ、著作権で保護された音声を生成するリクエストを認識してブロックするフィルターを採用したといい、法に違反したり、有害なコンテンツを生成したりするのを防ぐため、テキストベースのモデルに採用しているのと同じ安全性メカニズムをGPT-4oにも適用したという。

オープンAIは将来的に、映像や画面共有などさらに高度な機能を搭載し、AIアシスタントの能力を高めていく計画だ。5月のデモでは、社員がスマートフォンのカメラを紙片に向け、AIに一緒に数式を解いてほしいと頼んだ。また、コンピューターの画面を共有し、コーディングの問題を解決するためモデルに支援を依頼した。オープンAI によれば、以上の機能は現時点では利用できないが、いずれ使えるようになるという。期日は発表されていない。

人気の記事ランキング
  1. Inside the tedious effort to tally AI’s energy appetite 動画生成は別次元、思ったより深刻だったAIの電力問題
  2. Promotion Call for entries for Innovators Under 35 Japan 2025 「Innovators Under 35 Japan」2025年度候補者募集のお知らせ
  3. IBM aims to build the world’s first large-scale, error-corrected quantum computer by 2028 IBM、世界初の大規模誤り訂正量子コンピューター 28年実現へ
  4. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
メリッサ・ヘイッキラ [Melissa Heikkilä]米国版 AI担当上級記者
MITテクノロジーレビューの上級記者として、人工知能とそれがどのように社会を変えていくかを取材している。MITテクノロジーレビュー入社以前は『ポリティコ(POLITICO)』でAI政策や政治関連の記事を執筆していた。英エコノミスト誌での勤務、ニュースキャスターとしての経験も持つ。2020年にフォーブス誌の「30 Under 30」(欧州メディア部門)に選出された。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る