「アレクサ、アマゾンは
グーグルに勝てる?」
「はい、余裕です」
アレクサに毎日頼み事をする何百万ものユーザーのおかげで、アマゾンは家庭向け音声アシスタント市場でグーグルよりもずっと有利なポジションにある。 by Tom Simonite2017.01.19
「ヘイ、アレクサ」――米国の家庭で何百万人もが、そのときどきの希望をアマゾンに伝える直前に口にしているのがこのフレーズだ。アマゾンは台所用品を注文したり、部屋の電気をつけたり、音楽を流したりと、アレクサに何かを依頼する人全員から、競合企業の追撃をかわし、音声操作型アシスタントの可能性を高めるブレークスルー実現に欠かせないデータを大量に取得している。
音声認識技術の専門家で、アレクサとエコーを生んだ開発チームの創設メンバーでもあるアマゾンのニッコ・ストロム上級主任科学者は、AIフロンティア会議(カリフォルニア州サンタクララで先週開かれた)で「家庭内に何百万台も設置されたアマゾン・エコーが集めているのは、塵やホコリではありません。ものすごい量のデータが手に入るのです。私たちの研究に有用なデータがね」と述べた。
ストロム上級主任科学者によると、エコーが集めたデータはすでに、音声認識分野の積年の課題である「カクテル・パーティー問題」(大勢が同時に話している中で、ひとりの声を認識させる研究)をアマゾンが解決する手がかりになったという。
アレクサは当初から誰かに「アレクサ」と話しかけられたことは認識できたが、他の音声認識システム同様、名前の前後に話された言葉のうち、どれがユーザーの依頼を指すのかは、なかなか判別できなかった。そこでストロム上級主任科学者のチームは「アレクサ」と話しかけられたときの声の特徴を記録し、ユーザーの依頼を示す言葉を探り当てるシステムを開発した。
カクテル・パーティー問題等に挑むため、アマゾンは他にはないデータを収集して …
- 人気の記事ランキング
-
- Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
- Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
- Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
- Text-to-image AI models can be tricked into generating disturbing images AIモデル、「脱獄プロンプト」で不適切な画像生成の新手法
- What is the chance your plane will be hit by space debris? 空からゴミが降ってくる—— 衛星10万基時代のリスク、 航空への影響は?【解説】
