KADOKAWA Technology Review
×
Baidu Is Bringing Intelligent AR to the Masses

バイドゥが
「電脳コイル」を実現

コンピュータービジョンと自然言語処理を組み合わせた拡張現実で、数億人のユーザーがレイヤーを拡張された現実を体験する。 by Jamie Condliffe2016.08.03

中国の大手インターネット企業バイドゥが発表した新しいARプラットフォームは、ユーザーが多岐にわたるアプリのテクノロジーを利用できる。

DuSeeと呼ばれるシステムは「高度なコンピュータービジョンと深層学習」により「ユーザーが3次元環境を理解し、現実世界を操作し、フィードバックを受けられるバーチャルオブジェクトが作成できるという。DuSeeは、ポケモンGOや、より進んだ最新テクノロジーを使用するグーグルのTangoのような基礎的ARシステムのひとつのようだ。ポケモンGO型なら、単にアニメーションをデバイスの画面に映し出して現実世界に違和感なく表示し、Tango型なら、3Dカメラテクノロジーで、周囲の環境を映像として、ビジュアルグラフィックスを重ねる。

一方でDuSeeは、スマホのカメラに映った被写体をコンピュータービジョンで検知して解釈し、ユーザーに追加情報を表示する。

バイドゥはDuSeeの使用例を2つ示した。ひとつは、ソフトウェアが上海の2次元地図を認識し、SimCityのような3次元のイラストに書き起こす。もうひとつは、シャンプーの広告を識別し、花を基調とするブランドイメージに調和するバーチャルな花びらを追加し、広告が空間を動き回っても花びらの位置は変わらない。

恐らく、もっとも素晴らしいことは、バイドゥはDuSeeをモバイルBaidu検索など、最も人気の高い自社アプリに用いる計画を立てていることだ。アプリだけでも数百万人のユーザーに使われており、ARはすぐに多くの人の生活の一部になるのだ。

バイドゥは、近年AIシステムへの投資を倍増させている。過去には、本当にくだらないけれど大がかりな画像加工ソフトを手掛けたり、役立つ製品や試作品を開発するために、中国の国産深層学習システム「パドル」を使ったりしてきた。中には、コンピュータービジョンで画像を音声に変換して、目の前に何があるかを視覚障害者に伝えるヘッドセットや、音声インターフェイス用の強力な音声認識ソフトもある。実際、バイドゥは「ARと言語認識や自然言語処理をDuSeeに統合するなど、将来の方向性に期待しています」と述べている。

可愛いキャラクターや魅力的な遊び方で人気のポケモンGO(中国ではまだ公開されていない)は、全世界にARの魅力を広めた。一方でバイドゥは本当に知的な拡張現実体験を一般大衆に最初に提供するかもしれない。

関連ページ

人気の記事ランキング
  1. We finally have a definition for open-source AI 「オープンソースAI」問題ついに決着、OSIが定義を発表
  2. Here’s how people are actually using AI カネにならない生成AIブーム、LLMはどう使われているか?
  3. The US physics community is not done working on trust 物理学界で繰り返される研究不正、再発防止には何が必要か
ジェイミー コンドリフ [Jamie Condliffe]米国版 ニュース・解説担当副編集長
MIT Technology Reviewのニュース・解説担当副編集長。ロンドンを拠点に、日刊ニュースレター「ザ・ダウンロード」を米国版編集部がある米国ボストンが朝を迎える前に用意するのが仕事です。前職はニューサイエンティスト誌とGizmodoでした。オックスフォード大学で学んだ工学博士です。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年も候補者の募集を開始しました。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る