KADOKAWA Technology Review
×
Developers Expand Amazon Alexa’s Skills—Exposing Both Its Potential and Its Limitations

アマゾンの音声アシスタント
Amazon Echoの実力と限界

アマゾンは、アプリこそ音声認識スピーカーEcho成功の鍵だとわかっている。 by Stacey Higginbotham2016.08.11

高さ23センチの円筒に話掛けるだけでこれ程多くのことができるとは、まさに驚きだ。

アマゾンのホームスピーカー「Echo」と装置内蔵する音声アシスタントに「Alexa」と呼びかければいつでも動き出す。聞きたい音楽の頭出しをしたり、ウーバーで車を呼んだり、ゲームしたりできる。もしインターネットに接続したホームデバイスが有れば、両腕が食料品で一杯に塞がっていても、照明が付けられるし、指一本動かさずに、エアコンの温度も調節できる。信じられないくらい便利だ。

アマゾンは既に推定400万台のEchoデバイスを販売しており、グーグルも真似をしてGoogle Homeを作った。eコマースの巨大企業であるアマゾンは今や、他社のサービスとAlexaを組み込ませることによって、他社にAlexaの能力を拡大させようとしている。

Amazon’s voice-activated assistant Alexa is built into (left to right) the Tap portable speaker, FireTV set-top box, Echo speaker, and Echo Dot speaker.
アマゾンの音声作動アシスタントAlexaは、左から、タップボータブルスピーカー、FireTVセットトップボックス、EchoDotスピーカーに内蔵されている

この発想は、ちょうどアプリがスマートフォンをより便利にして、より人気になるようにしたのと似ている。Alexaのアプリは「スキル」と呼ばれていて、アマゾンにとって、Echoをさらに強力で儲かるようにしている。既にEchoに対応する2000以上のスキルが存在する。5月のコードカンファレンスでアマゾンのジェフ・ベゾスCEOは、このテクノロジーの現状を「まさに氷山の一角」だといった。

開発者が追加する機能は、プラットフォームの有望さを示す一方で、機能の限界も露呈させてしまう。

Echoの最も有益なスキルの多くは、スマートホームデバイスと共に機能する。たとえば、スマートホームの主要企業インステオンは、Echoから「Alexa、寝室の設定温度を3度下げて」といって制御できるエアコンをはじめ、電球など数十種類のスマートデバイスを扱っている。他にも、ドミノでピザを注文したり、キャピタルワンのクレジットカードで支払えたりするアプリもある。ところが、スマートロック「August」の所有者は、音声命令でドアを施錠できるが、ドアの解錠はできない。アマゾンは、セキュリティ上の予期しない結果に懸念を抱いているからだ。

Alexaはビジネスでも役に立つ。会議の席に座らせて、文字通り意見を述べられる立場にあるのだ。ビジネス分析企業サイセンスの顧客は「ヨーロッパ地域の第4四半期の総収入はいくらか」といった質問を、Alexaにインストールしたサイセンスのスキルに尋ねれば、答えが得られる。同社の顧客は、今や会議室にEchoを設置している、とサイセンスのアミール・オラドCEOはいう。

コラボレーションソフトウエア企業シトリックス・システムズもEchoを職場に導入している。シトリックスは顧客が会議室を予約し、音声命令によって、照明と設備を制御する方法を構築している。IT管理者は、シトリックスのプログラムが動作しているかを確認するために、Alexaに声を掛けるだけでいい。

しかしEchoとAlexaには、多くの限界がある。まず、「自然に」Alexaに話し掛けるように説明されているが、具体的な言葉とフレーズを使わなければならない。たとえば、一度にひとつのことしか指示できないので、ベッドに行く時「Alexa、階段の電灯を消したらエアコンの設定温度を21度に設定して、アラームを午前7時にして」とは声をかけられないのだ。それぞれの行動を別々に要求し、その都度反応を待たなければならない。

Echoのプラットフォームに乗っかりながら、Echoの至らないところを補って自社の仕事を見つける会社もある。スマートホーム事業者のヨノミは、Alexaに一回の音声命令で、全てを制御できる複合ホームデバイスと接続するソフトウエアを構築している。ちょっとした設定後なら、テレビを付け、画面上のネットフリックスを開いて、照明を薄暗くするために「Alexa、NetflixとChillをオンにして」と指示できる。

デザイン企業のアルゴデザイン創業者で、フロッグデザインの元クリエイティブ担当重役マーク・ロルストンは、現在のAlexaは、もっと多くの基本的な問題を抱えているという。もしAlexaを今の便利な商品以上にするには、聴覚情報だけではなく、たとえば画面上にAlexaが情報を示すことによって、人間とコミュニケーションが取れるようにするべきだ、とロルストンはいう。

「もしアマゾンがこんなふうにAlexaを販売し続けたいなら、Alexaには壁にぶつかります」とロルストンいう。シトリックスのコアインフラストラクチャーを担当するスティーブ・ウィルソン副社長も「Alexaはアップストアが登場する以前のiPhoneのようなものです」と同意している。「音声だけでは、十分なインタラクションになりません。もしさらに詳細なインタラクションを実現したいなら、画面を見る必要があります」と以前シトリックスでAlexaスキルの開発に関わっていたウィルソン副社長もいった。

アマゾンはAlexaに対する質問の答えを、Alexaと連動するスマホアプリ上に確かに表示させてはいる。だが、ほとんど全ての場合、Alexaに質問したことは音声で答えが返ってくる。たとえば、Alexaに近くのレストランのランチメニューを尋ねても、スマートフォンには表示されない(近日発売予定のGoogle Homeのプロモーションビデオでは、地図のような情報をスマートフォンに教示させる装置があるが、その機能が最終製品に搭載されるかは不明だ)。

音声インターフェイスのもう別の課題は、認証問題だ。現在、ユーザーはセットアップ時にPINを設定できる。ユーザーはAlexaで何かを購入するとき、必ずPINを声に出さなければならないが、PINで安全を保つには、PINが誰にも知られないことが前提だ。たとえば、保護者は、クレジットカードでモノを買うのに必要なPINを子どもに聞かれたくはないだろう。

Echoの驚くべき成功により、問題点の解決でも先手を打てたことは、アマゾンは競合他社より有利なスタートを切れた。何百万人のユーザーや、Echoのプラットフォームに統合しようと取り組んでいるたくさんの企業は、おしゃべりな円筒を、あらゆる家庭の必需品のひとつにする手段を考えようと、Echoが使えるデータをたくさんアマゾンに提供するだろう。

人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. These materials were meant to revolutionize the solar industry. Why hasn’t it happened? 参入相次ぐ「ペロブスカイト太陽光電池」、実用化はいつ?
  4. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. These materials were meant to revolutionize the solar industry. Why hasn’t it happened? 参入相次ぐ「ペロブスカイト太陽光電池」、実用化はいつ?
  4. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
MITテクノロジーレビュー[日本版] Vol.6
MITテクノロジーレビュー[日本版] Vol.6世界を変えるイノベーター50人

mRNAがん治療の事業化を目指す起業家、日本発の量子コンピューター技術を提唱する研究者、グーグルが採用した人工音声を開発した技術者、中国の次世代人工太陽の理論モデルを確立した科学者——。
MITテクノロジーレビューが選んだ、世界のイノベーター35人と日本発のイノベーター15人を一挙紹介。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る