ロボット工学

Developers Expand Amazon Alexa’s Skills—Exposing Both Its Potential and Its Limitations アマゾンの音声アシスタント
Amazon Echoの実力と限界

アマゾンは、アプリこそ音声認識スピーカーEcho成功の鍵だとわかっている。 by Stacey Higginbotham2016.08.11

高さ23センチの円筒に話掛けるだけでこれ程多くのことができるとは、まさに驚きだ。

アマゾンのホームスピーカー「Echo」と装置内蔵する音声アシスタントに「Alexa」と呼びかければいつでも動き出す。聞きたい音楽の頭出しをしたり、ウーバーで車を呼んだり、ゲームしたりできる。もしインターネットに接続したホームデバイスが有れば、両腕が食料品で一杯に塞がっていても、照明が付けられるし、指一本動かさずに、エアコンの温度も調節できる。信じられないくらい便利だ。

アマゾンは既に推定400万台のEchoデバイスを販売しており、グーグルも真似をしてGoogle Homeを作った。eコマースの巨大企業であるアマゾンは今や、他社のサービスとAlexaを組み込ませることによって、他社にAlexaの能力を拡大させようとしている。

Amazon’s voice-activated assistant Alexa is built into (left to right) the Tap portable speaker, FireTV set-top box, Echo speaker, and Echo Dot speaker.

アマゾンの音声作動アシスタントAlexaは、左から、タップボータブルスピーカー、FireTVセットトップボックス、EchoDotスピーカーに内蔵されている

この発想は、ちょうどアプリがスマートフォンをより便利にして、より人気になるようにしたのと似ている。Alexaのアプリは「スキル」と呼ばれていて、アマゾンにとって、Echoをさらに強力で儲かるようにしている。既にEchoに対応する2000以上のスキルが存在する。5月のコードカンファレンスでアマゾンのジェフ・ベゾスCEOは、このテクノロジーの現状を「まさに氷山の一角」だといった。

開発者が追加する機能は、プラットフォームの有望さを示す一方で、機能の限界も露呈させてしまう。

Echoの最も有益なスキルの多くは、スマートホームデバイスと共に機能する。たとえば、スマートホームの主要企業インステオンは、Echoから「Alexa、寝室の設定温度を3度下げて」といって制御できるエアコンをはじめ、電球など数十種類のスマートデバイスを扱っている。他にも、ドミノでピザを注文したり、キャピタルワンのクレジットカードで支払えたりするアプリもある。ところが、スマートロック「August」の所有者は、音声命令でドアを施錠できるが、ドアの解錠はできない。アマゾンは、セキュリティ上の予期しない結果に懸念を抱いているからだ。

Alexaはビジネスでも役に立つ。会議の席に座らせて、文字通り意見を述べられる立場にあるのだ。ビジネス分析企業サイセンスの顧客は「ヨーロッパ地域の第4四半期の総収入はいくらか」といった質問を、Alexaにインストールしたサイセンスのスキルに尋ねれば、答えが得られる。同社の顧客は、今や会議室にEchoを設置している、とサイセンスのアミール・オラドCEOはいう。

コラボレーションソフトウエア企業シトリックス・システムズもEchoを職場に導入している。シトリックスは顧客が会議室を予約し、音声命令によって、照明と設備を制御する方法を構築している。IT管理者は、シトリックスのプログラムが動作しているかを確認するために、Alexaに声を掛けるだけでいい。

しかしEchoとAlexaには、多くの限界がある。まず、「自然に」Alexaに話し掛けるように説明されているが、具体的な言葉とフレーズを使わなければならない。たとえば、一度にひとつのことしか指示できないので、ベッドに行く時「Alexa、階段の電灯を消したらエアコンの設定温度を21度に設定して、アラームを午前7時にして」とは声をかけられないのだ。それぞれの行動を別々に要求し、その都度反応を待たなければならない。

Echoのプラットフォームに乗っかりながら、Echoの至らないところを補って自社の仕事を見つける会社もある。スマートホーム事業者のヨノミは、Alexaに一回の音声命令で、全てを制御できる複合ホームデバイスと接続するソフトウエアを構築している。ちょっとした設定後なら、テレビを付け、画面上のネットフリックスを開いて、照明を薄暗くするために「Alexa、NetflixとChillをオンにして」と指示できる。

デザイン企業のアルゴデザイン創業者で、フロッグデザインの元クリエイティブ担当重役マーク・ロルストンは、現在のAlexaは、もっと多くの基本的な問題を抱えているという。もしAlexaを今の便利な商品以上にするには、聴覚情報だけではなく、たとえば画面上にAlexaが情報を示すことによって、人間とコミュニケーションが取れるようにするべきだ、とロルストンはいう。

「もしアマゾンがこんなふうにAlexaを販売し続けたいなら、Alexaには壁にぶつかります」とロルストンいう。シトリックスのコアインフラストラクチャーを担当するスティーブ・ウィルソン副社長も「Alexaはアップストアが登場する以前のiPhoneのようなものです」と同意している。「音声だけでは、十分なインタラクションになりません。もしさらに詳細なインタラクションを実現したいなら、画面を見る必要があります」と以前シトリックスでAlexaスキルの開発に関わっていたウィルソン副社長もいった。

アマゾンはAlexaに対する質問の答えを、Alexaと連動するスマホアプリ上に確かに表示させてはいる。だが、ほとんど全ての場合、Alexaに質問したことは音声で答えが返ってくる。たとえば、Alexaに近くのレストランのランチメニューを尋ねても、スマートフォンには表示されない(近日発売予定のGoogle Homeのプロモーションビデオでは、地図のような情報をスマートフォンに教示させる装置があるが、その機能が最終製品に搭載されるかは不明だ)。

音声インターフェイスのもう別の課題は、認証問題だ。現在、ユーザーはセットアップ時にPINを設定できる。ユーザーはAlexaで何かを購入するとき、必ずPINを声に出さなければならないが、PINで安全を保つには、PINが誰にも知られないことが前提だ。たとえば、保護者は、クレジットカードでモノを買うのに必要なPINを子どもに聞かれたくはないだろう。

Echoの驚くべき成功により、問題点の解決でも先手を打てたことは、アマゾンは競合他社より有利なスタートを切れた。何百万人のユーザーや、Echoのプラットフォームに統合しようと取り組んでいるたくさんの企業は、おしゃべりな円筒を、あらゆる家庭の必需品のひとつにする手段を考えようと、Echoが使えるデータをたくさんアマゾンに提供するだろう。

人気の記事ランキング
  1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  2. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  3. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  4. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持
この記事をシェアしてください!
この記事が気に入ったら
いいね!しよう
コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

0 コメント
    「インターフェイス」の記事
    人気の記事ランキング
    1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
    2. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
    3. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
    4. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
    5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持