KADOKAWA Technology Review
×
【5/24まで】ひと月あたり1000円で購読できる春のキャンペーン実施中!
Baidu Is Bringing Intelligent AR to the Masses

バイドゥが
「電脳コイル」を実現

コンピュータービジョンと自然言語処理を組み合わせた拡張現実で、数億人のユーザーがレイヤーを拡張された現実を体験する。 by Jamie Condliffe2016.08.03

中国の大手インターネット企業バイドゥが発表した新しいARプラットフォームは、ユーザーが多岐にわたるアプリのテクノロジーを利用できる。

DuSeeと呼ばれるシステムは「高度なコンピュータービジョンと深層学習」により「ユーザーが3次元環境を理解し、現実世界を操作し、フィードバックを受けられるバーチャルオブジェクトが作成できるという。DuSeeは、ポケモンGOや、より進んだ最新テクノロジーを使用するグーグルのTangoのような基礎的ARシステムのひとつのようだ。ポケモンGO型なら、単にアニメーションをデバイスの画面に映し出して現実世界に違和感なく表示し、Tango型なら、3Dカメラテクノロジーで、周囲の環境を映像として、ビジュアルグラフィックスを重ねる。

一方でDuSeeは、スマホのカメラに映った被写体をコンピュータービジョンで検知して解釈し、ユーザーに追加情報を表示する。

バイドゥはDuSeeの使用例を2つ示した。ひとつは、ソフトウェアが上海の2次元地図を認識し、SimCityのような3次元のイラストに書き起こす。もうひとつは、シャンプーの広告を識別し、花を基調とするブランドイメージに調和するバーチャルな花びらを追加し、広告が空間を動き回っても花びらの位置は変わらない。

恐らく、もっとも素晴らしいことは、バイドゥはDuSeeをモバイルBaidu検索など、最も人気の高い自社アプリに用いる計画を立てていることだ。アプリだけでも数百万人のユーザーに使われており、ARはすぐに多くの人の生活の一部になるのだ。

バイドゥは、近年AIシステムへの投資を倍増させている。過去には、本当にくだらないけれど大がかりな画像加工ソフトを手掛けたり、役立つ製品や試作品を開発するために、中国の国産深層学習システム「パドル」を使ったりしてきた。中には、コンピュータービジョンで画像を音声に変換して、目の前に何があるかを視覚障害者に伝えるヘッドセットや、音声インターフェイス用の強力な音声認識ソフトもある。実際、バイドゥは「ARと言語認識や自然言語処理をDuSeeに統合するなど、将来の方向性に期待しています」と述べている。

可愛いキャラクターや魅力的な遊び方で人気のポケモンGO(中国ではまだ公開されていない)は、全世界にARの魅力を広めた。一方でバイドゥは本当に知的な拡張現実体験を一般大衆に最初に提供するかもしれない。

関連ページ

人気の記事ランキング
  1. Why EV charging needs more than Tesla EVシフト、充電部門閉鎖で明らかになった「テスラ頼み」の危うさ
  2. AI models can outperform humans in tests to identify mental states AIが「心の理論」テストで人間超え、この結果は何を意味するか
  3. The way whales communicate is closer to human language than we realized クジラの言語構造、想像以上に人間の言語に近かった
  4. OpenAI and Google are launching supercharged AI assistants. Here’s how you can try them out. さよならAlexa、オープンAIとグーグルのAIアシスタントが超進化
ジェイミー コンドリフ [Jamie Condliffe]米国版 ニュース・解説担当副編集長
MIT Technology Reviewのニュース・解説担当副編集長。ロンドンを拠点に、日刊ニュースレター「ザ・ダウンロード」を米国版編集部がある米国ボストンが朝を迎える前に用意するのが仕事です。前職はニューサイエンティスト誌とGizmodoでした。オックスフォード大学で学んだ工学博士です。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. Why EV charging needs more than Tesla EVシフト、充電部門閉鎖で明らかになった「テスラ頼み」の危うさ
  2. AI models can outperform humans in tests to identify mental states AIが「心の理論」テストで人間超え、この結果は何を意味するか
  3. The way whales communicate is closer to human language than we realized クジラの言語構造、想像以上に人間の言語に近かった
  4. OpenAI and Google are launching supercharged AI assistants. Here’s how you can try them out. さよならAlexa、オープンAIとグーグルのAIアシスタントが超進化
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る