KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
AIを取り込むロボット企業、ロボットに進出するAI企業
Gemini Robotics
When you might start speaking to robots

AIを取り込むロボット企業、ロボットに進出するAI企業

グーグルは大規模言語モデル「ジェミニ(Gemini)」をロボット制御向けに適用した「ジェミニ・ロボティクス(Gemini Robotics)」を発表した。ロボット企業がAIを積極採用する流れと、AI大手が物理世界へ進出する逆方向からの潮流が交わる象徴的な出来事だ。 by James O'Donnell2025.03.24

この記事の3つのポイント
  1. グーグルがロボットに指示を出せるAIモデル「Gemini Robotics」を発表した
  2. AI大手がロボット開発に乗り出し、ロボット工学企業はAIを活用し始めている
  3. 人間との協働には安全基準確立が必要で、家庭向けはまだ時間がかかりそう
summarized by Claude 3

グーグルが3月12日に発表した内容はちょっとしたサプライズだった。チャットボットやインターネット検索といったデジタルの世界だけでなく、私たちがいる物理的な世界でもロボットを介してものごとを処理できる、人工知能(AI)モデル「ジェミニ(Gemini)」の派生版を発表したのだ。

ジェミニ・ロボティクス(Gemini Robotics)は、大規模言語モデル(LLM)の能力と空間的推論を融合させることで、ロボットアームに指示を出して「透明なガラスのボウルにブドウを入れる」といったタスクを実行させることができる。命令はLLMによってフィルタリングされ、LLMが指示の内容から意図を特定し、ロボットが実行可能な命令に分解するのだ。その仕組みの詳細は、本誌のスコット・マリガン記者の記事全文をお読みいただきたい。

このニュースを受けて、いつか自宅や職場がロボットでいっぱいになり、大声で命令できるようになるかもしれない——。そう思った人も多いかもしれない。これについては近日公開予定の詳細な記事をご覧いただきたい。

そもそも、こうした動きはいったいどこから来たのだろうか? グーグルはこれまでのところ、ロボット工学の世界で大きな波を起こしてはいない。アルファベット(グーグルの持株会社)は過去10年間にいくつかのロボット工学スタートアップを買収したが、2023年にゴミ掃除のような実用的なタスクを担うロボットの開発に取り組んでいた部門を閉鎖した

にもかかわらず、ロボットを介してAIを物理的な世界に持ち込もうとする同社の動きは、まさに過去2年間で他社が作ってきた先例をなぞっている(謙虚に指摘しなければならないが、これはMITテクノロジーレビューがこの記事をはじめ以前から予見していた動きだ)。

つまり、2つのトレンドが正反対の方向から収束しつつあるのだ。ロボット工学企業はますますAIを活用するようになっており、AI大手は今、ロボットを作っている。たとえば、2021年にロボット工学チームを閉鎖したオープンAI(OpenAI)は今年、人型ロボットの開発に向けた新たな取り組みを始めた。昨年10月には半導体大手のエヌビディア(Nvidia)が、AIの次の波は「物理的AI(physical AI)」であると宣言している。

ロボットにAIを組み込む方法は、タスクを処理するための訓練方法の改善など、数多く存在する。しかし、今回グーグルが発表したような、LLMを利用して指示を与える方法は、特に興味深いものだ。

これは、初めての試みではない。ロボット工学スタートアップのフィギュア(Figure)は1年前、ある動画をきっかけに話題になった。その動画では、人間が人型ロボットに対し、食器の片付け方に関する指示を出していた。同じ頃、オープンAIからスピンオフしたスタートアップのコバリアント(Covariant)が、倉庫内に設置したロボットアーム向けに同様のものを構築した。私が見たデモでは、画像やテキスト、あるいは動画でロボットに指示を与え、「テニスボールをこの箱からあの箱へ移動」といったような作業をさせることができた。コバリアントはそれからわずか5カ月後に、アマゾンに買収された。

そのようなデモを見れば、あれこれ考えずにはいられないだろう。このようなロボットはいつ私たちの職場にやってくるのだろうか? 自宅でも使えるのだろうか?

フィギュアの計画がヒントになるとすれば、最初の質問に対する答えは「もうすぐ」だ。同社は3月15日に、年間1万2000台の人型ロボットを製造できる工場を建設中だと発表した。しかし、ロボットの訓練とテスト、特に人間に近い場所で動作させるときの安全性を確保するための訓練とテストには、まだ時間がかかる

たとえば、フィギュアの競合であるアジリティ・ロボティクス(Agility Robotics)は、人型ロボットを購入してくれる顧客を持つ企業は、米国で自分たちだけであると主張している。しかし、人間と一緒に働く人型ロボットの業界の安全基準はまだ完全なものではないため、同社のロボットは人間がいない場所で作業しなくてはならない。

このような事情があるため、最近進歩しているとはいえ、私たちの自宅が最後の難関となるだろう。工場の床と比べると、私たちの自宅は散らかっており、予測不可能だ。誰もが比較的狭苦しい場所に押し込められている。ジェミニ・ロボティクスのような感動的にすばらしいAIモデルでさえも、自動運転車と同じように、まだ現実世界とシミュレーションの両方で多くのテストを受ける必要がある。そのようなテストは倉庫、ホテル、病院などでも必要になるかもしれない。その際にロボットは、離れた場所にいる人間のオペレーターが遠隔で支援しているかもしれない。ロボットに私たちの食器を片付ける特権が与えられるまでには、まだ時間がかかりそうだ。

人気の記事ランキング
  1. A new US phone network for Christians aims to block porn and gender-related content ポルノもLGBTも遮断、キリスト教徒向けMVNOが米国で登場
  2. Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models 「オープンAIを蒸留した」マスク対アルトマン第1週、法廷がざわめく
  3. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
ジェームス・オドネル [James O'Donnell]米国版 AI/ハードウェア担当記者
自律自動車や外科用ロボット、チャットボットなどのテクノロジーがもたらす可能性とリスクについて主に取材。MITテクノロジーレビュー入社以前は、PBSの報道番組『フロントライン(FRONTLINE)』の調査報道担当記者。ワシントンポスト、プロパブリカ(ProPublica)、WNYCなどのメディアにも寄稿・出演している。
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る