KADOKAWA Technology Review
×
AIを取り込むロボット企業、ロボットに進出するAI企業
Gemini Robotics
When you might start speaking to robots

AIを取り込むロボット企業、ロボットに進出するAI企業

グーグルは大規模言語モデル「ジェミニ(Gemini)」をロボット制御向けに適用した「ジェミニ・ロボティクス(Gemini Robotics)」を発表した。ロボット企業がAIを積極採用する流れと、AI大手が物理世界へ進出する逆方向からの潮流が交わる象徴的な出来事だ。 by James O'Donnell2025.03.24

この記事の3つのポイント
  1. グーグルがロボットに指示を出せるAIモデル「Gemini Robotics」を発表した
  2. AI大手がロボット開発に乗り出し、ロボット工学企業はAIを活用し始めている
  3. 人間との協働には安全基準確立が必要で、家庭向けはまだ時間がかかりそう
summarized by Claude 3

グーグルが3月12日に発表した内容はちょっとしたサプライズだった。チャットボットやインターネット検索といったデジタルの世界だけでなく、私たちがいる物理的な世界でもロボットを介してものごとを処理できる、人工知能(AI)モデル「ジェミニ(Gemini)」の派生版を発表したのだ。

ジェミニ・ロボティクス(Gemini Robotics)は、大規模言語モデル(LLM)の能力と空間的推論を融合させることで、ロボットアームに指示を出して「透明なガラスのボウルにブドウを入れる」といったタスクを実行させることができる。命令はLLMによってフィルタリングされ、LLMが指示の内容から意図を特定し、ロボットが実行可能な命令に分解するのだ。その仕組みの詳細は、本誌のスコット・マリガン記者の記事全文をお読みいただきたい。

このニュースを受けて、いつか自宅や職場がロボットでいっぱいになり、大声で命令できるようになるかもしれない——。そう思った人も多いかもしれない。これについては近日公開予定の詳細な記事をご覧いただきたい。

そもそも、こうした動きはいったいどこから来たのだろうか? グーグルはこれまでのところ、ロボット工学の世界で大きな波を起こしてはいない。アルファベット(グーグルの持株会社)は過去10年間にいくつかのロボット工学スタートアップを買収したが、2023年にゴミ掃除のような実用的なタスクを担うロボットの開発に取り組んでいた部門を閉鎖した

にもかかわらず、ロボットを介してAIを物理的な世界に持ち込もうとする同社の動きは、まさに過去2年間で他社が作ってきた先例をなぞっている(謙虚に指摘しなければならないが、これはMITテクノロジーレビューがこの記事をはじめ以前から予見していた動きだ)。

つまり、2つのトレンドが正反対の方向から収束しつつあるのだ。ロボット工学企業はますますAIを活用するようになっており、AI大手は今、ロボットを作っている。たとえば、2021年にロボット工学チームを閉鎖したオープンAI(OpenAI)は今年、人型ロボットの開発に向けた新たな取り組みを始めた。昨年10月には半導体大手のエヌビディア(Nvidia)が、AIの次の波は「物理的AI(physical AI)」であると宣言している。

ロボットにAIを組み込む方法は、タスクを処理するための訓練方法の改善など、数多く存在する。しかし、今回グーグルが発表したような、LLMを利用して指示を与える方法は、特に興味深いものだ。

これは、初めての試みではない。ロボット工学スタートアップのフィギュア(Figure)は1年前、ある動画をきっかけに話題になった。その動画では、人間が人型ロボットに対し、食器の片付け方に関する指示を出していた。同じ頃、オープンAIからスピンオフしたスタートアップのコバリアント(Covariant)が、倉庫内に設置したロボットアーム向けに同様のものを構築した。私が見たデモでは、画像やテキスト、あるいは動画でロボットに指示を与え、「テニスボールをこの箱からあの箱へ移動」といったような作業をさせることができた。コバリアントはそれからわずか5カ月後に、アマゾンに買収された。

そのようなデモを見れば、あれこれ考えずにはいられないだろう。このようなロボットはいつ私たちの職場にやってくるのだろうか? 自宅でも使えるのだろうか?

フィギュアの計画がヒントになるとすれば、最初の質問に対する答えは「もうすぐ」だ。同社は3月15日に、年間1万2000台の人型ロボットを製造できる工場を建設中だと発表した。しかし、ロボットの訓練とテスト、特に人間に近い場所で動作させるときの安全性を確保するための訓練とテストには、まだ時間がかかる

たとえば、フィギュアの競合であるアジリティ・ロボティクス(Agility Robotics)は、人型ロボットを購入してくれる顧客を持つ企業は、米国で自分たちだけであると主張している。しかし、人間と一緒に働く人型ロボットの業界の安全基準はまだ完全なものではないため、同社のロボットは人間がいない場所で作業しなくてはならない。

このような事情があるため、最近進歩しているとはいえ、私たちの自宅が最後の難関となるだろう。工場の床と比べると、私たちの自宅は散らかっており、予測不可能だ。誰もが比較的狭苦しい場所に押し込められている。ジェミニ・ロボティクスのような感動的にすばらしいAIモデルでさえも、自動運転車と同じように、まだ現実世界とシミュレーションの両方で多くのテストを受ける必要がある。そのようなテストは倉庫、ホテル、病院などでも必要になるかもしれない。その際にロボットは、離れた場所にいる人間のオペレーターが遠隔で支援しているかもしれない。ロボットに私たちの食器を片付ける特権が与えられるまでには、まだ時間がかかりそうだ。

人気の記事ランキング
  1. A long-abandoned US nuclear technology is making a comeback in China 中国でトリウム原子炉が稼働、見直される過去のアイデア
  2. Here’s why we need to start thinking of AI as “normal” AIは「普通」の技術、プリンストン大のつまらない提言の背景
  3. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
ジェームス・オドネル [James O'Donnell]米国版 AI/ハードウェア担当記者
自律自動車や外科用ロボット、チャットボットなどのテクノロジーがもたらす可能性とリスクについて主に取材。MITテクノロジーレビュー入社以前は、PBSの報道番組『フロントライン(FRONTLINE)』の調査報道担当記者。ワシントンポスト、プロパブリカ(ProPublica)、WNYCなどのメディアにも寄稿・出演している。
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る