グーグルが生成AI「ジェミニ」全面展開、「バード」から切り替え
グーグルは生成AI「バード(Bard)」を廃止して、ジェミニ(Gemini)に統一する。チャットGPT型のチャット・サービスのほか、Gmailやグーグル・ドキュメントなどにも組み込む予定だ。 by Will Douglas Heaven2024.02.09
グーグルは、アンドロイドやiOS向けグーグル・アプリ、Gmail、ドキュメントなど、ほぼすべての自社製品に、大規模言語モデル・ファミリー「ジェミニ(Gemini)」を組み込むと発表した。マス市場への人工知能(AI)の展開としては、これまでで最大規模の動きとなる。新しいサブスクリプション・プランでは、ユーザーが初めて、このモデルの最も強力なバージョン「ジェミニ・ウルトラ(Gemini Ultra)」にもアクセスできるようになる。
またグーグルは、チャットGPT(ChatGPT)のライバルとして提供してきた「バード(Bard)」を廃止する。12月からジェミニのバージョンの1つを搭載していたバードも、今後はジェミニの名称で呼ばれるようになる。
マイクロソフトが支援するオープンAIがわずか14カ月前に発表したチャットGPTは、コンピューターができることに対する人々の期待を一変させた。それ以来、グーグルは遅れを取り戻そうと全力で開発を進め、12月に一連のモデル「ジェミニ」を発表した。音声、画像、テキストを通してユーザーとの対話が可能な、マルチモーダル大規模言語モデルである。グーグルの主張によれば、独自のベンチマークで評価したところ、一連の標準的なパフォーマンス・テストでジェミニがGPT-4を上回ったという。ただし、その差はごくわずかだった。
グーグルはジェミニを自社のユビキタス・ツールに組み込むことで巻き返しを図り、さらにはライバルを追い抜きたいと考えている。
「すべてのローンチが大きなものですが、今回はこれまでで最大です」とグーグル・アシスタントとバード(現在はジェミニ)の担当事業部長を務めるグーグルのシシー・シャオ副社長は2月7日の記者会見で述べた。「私たちは、今回のローンチを、当社の使命を前進させる最も核心的な方法の1つと考えています」。
しかし、一部の人たちは、他の人よりも長く待たないとグーグルの新しいツールで遊べないだろう。グーグルは米国と東アジアでの展開を発表しているが、英国、欧州連合(EU)、スイスへのアンドロイドおよびiOS向けアプリの展開時期については、何も語っていない。その理由として、グーグルはEUの新たなAI法が確定するのを待っているのかもしれないと、欧州議会議員としてAI法の主要な交渉役を務めたルーマニアの政治家、ドラゴシュ・トゥドラケは言う。
「私たちは、現地の規制要件を遵守していることを確認してから展開できるように、現地規制当局と連携しています」とシャオ副社長は話した。「安心してください。間違いなく、展開に向けて取り組んでいます。非常に近いうちに発表できることを願っています」。
どうすれば手に入れられる? 12月からバードを通じて利用できるようになったグーグルの中級モデル「ジェミニ・プロ」は、引き続きgemini.google.com(bard.google.comから変更)において無料で利用できる。現在はモバイル・アプリも存在する。アンドロイド端末を持っているなら、ジェミニ・アプリをダウンロードするか、もしくはグーグル・アシスタントでアップグレードを選択(オプトイン)すれば手に入れられる。これで、グーグル・アシスタントを使うときと同じ方法でジェミニを呼び出せるようになる。つまり、電源ボタンを押すか、画面の端からスワイプするか、または「ヘイ、グーグル!」と言えばよい。
呼び出すと、画面にジェミニがオーバーレイ表示されるので、質問したり、そのとき電話に表示されていることに関して(記事の要約や写真のキャプション作成などを)指示したりできる。
最後に、グーグルは新たなサブスクリプション・サービス「ジェミニ・アドバンスト(Gemini Advanced)」を開始する。既存のグーグル・ワン・プレミアム・プラン(Google One Premium Plan:ユーザーに追加のストレージと他のいくつかの特典を提供)の拡張版である。月額19.99ドルの新しいグーグル・ワン・プレミアムAIプラン(Google One Premium AI Plan)では、初めてグーグルの最も強力なモデルであるジェミニ・ウルトラを利用できるようになる。これは、オープンAIの提供するサービスと非常に似ている。オープンAIのチャットGPTプレミアム(ChatGPT Premium)は、月額19.99ドルでGPT-3.5ではなくGPT-4を利用できる。
正確な時期は明らかにされていないが、このサブスクリプションを契約することで、近い将来、グーグル・ワークスペース・アプリ(ドキュメント、スプレッドシート、スライドなど)全体でもジェミニが利用可能になる予定だ。マイクロソフトがオフィス365(Office 365)で試験的に導入している、GPT-4搭載のコパイロット(Copilot)と同様にスマート・アシスタントとして機能する。
いつ手に入れられる? 無料のジェミニ・アプリ(ジェミニ・プロ搭載)は、2月8日より米国で英語版が利用できる。2月第三週からはアジア太平洋地域でも、英語版、日本語版、韓国語版が利用できるようになる。しかし、このアプリの英国、EU諸国、スイスへの展開時期については言及がない。
ジェミニ・アドバンスト(ジェミニ・ウルトラにアクセスできる有料サービス)では、英国やEU諸国(フランスは除く)を含む150カ国以上で英語版を利用できる。グーグルは現在、現地の要件を分析し、各国の文化的ニュアンスに合わせてジェミニを微調整していると述べている。しかし、さらに多くの言語版が追加され、提供地域も増える予定だと話す。
何ができる? グーグルによれば、ジェミニ製品は100人以上のテスターとパワーユーザーの協力を得て開発されたという。2月7日の記者会見で、グーグルの幹部たちがいくつかの使用例を説明した。例えば、ジェミニの助けを借りて求職応募書類の送付状作成などだ。「自分をよりプロフェッショナルな印象に見せ、採用担当者との関係性を高めるのに役立ちます」とグーグルのクリスティーナ・ベア製品管理担当副社長は述べた。
あるいは、パンクしたタイヤの写真を撮って、ジェミニに修理方法を尋ねることもできる。もっと複雑な例では、サッカーチームに所属する子どもたちの保護者のために、ジェミニがおやつ当番を管理する使い方だ。誰がいつおやつを持ってくるか、ジェミニがローテーションを考え、他の保護者にメールで連絡したり、その返信をさばいたりするのも支援する。将来のバージョンでは、ジェミニがグーグル・ドライブのデータを利用できるようになり、試合スケジュールに合わせて送迎車の相乗り管理を手伝えるようになるかもしれないとベアは話した。
しかし、ユーザー自身がこれらのツールの用途をもっとたくさん見つけることを期待するべきである。「世界中の人々がこのAIの限界をどのように押し広げていくのか、本当に楽しみです」(シャオ副社長)。
安全なのか? グーグルは、自社の利口なAI搭載製品を安全に使用できるように懸命に取り組んできた。しかし、どんなにテストをしても、リリース後にこのテクノロジーがどのように利用されたり悪用されたりするか、すべて予測することはできない。ここ数カ月の間に、銃を持つミッキーマウスの写真や、ジェット機で2つのタワーに突っ込むスポンジボブの写真が、メタ(Meta)の画像生成アプリを使って作成された。マイクロソフトの画像生成ソフトウェアも、テイラー・スウィフトの偽ポルノ画像の作成に使われた。
(EUの)AI法は、これらの問題の(すべてではないが)一部を緩和することを目指している。例えば、ジェミニのような強力なAIの開発者に対し、生成された画像への電子透かしの挿入や、著作物の複製を避けるための措置などの、安全対策を組み込むことを求めている。グーグルは自社製品によって生成されるすべての画像に、シンスID(SynthID)透かしを入れると述べている。
チャットGPTが登場したとき、グーグルは他のほとんどの企業と同様に後手に回った。マイクロソフトはオープンAIとの提携によって、かつてのライバルよりも優位に立った。しかし、ジェミニによってグーグルは力強く復活した。ジェミニは、現世代の技術パッケージとしては、これまでで最も洗練されたものである。
- 人気の記事ランキング
-
- A tiny new open-source AI model performs as well as powerful big ones 720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル
- The coolest thing about smart glasses is not the AR. It’s the AI. ようやく物になったスマートグラス、真価はARではなくAIにある
- Geoffrey Hinton, AI pioneer and figurehead of doomerism, wins Nobel Prize in Physics ジェフリー・ヒントン、 ノーベル物理学賞を受賞
- Why OpenAI’s new model is such a big deal GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由
- ウィル・ダグラス・ヘブン [Will Douglas Heaven]米国版 AI担当上級編集者
- AI担当上級編集者として、新研究や新トレンド、その背後にいる人々を取材しています。前職では、テクノロジーと政治に関するBBCのWebサイト「フューチャー・ナウ(Future Now)」の創刊編集長、ニュー・サイエンティスト(New Scientist)誌のテクノロジー統括編集長を務めていました。インペリアル・カレッジ・ロンドンでコンピュータサイエンスの博士号を取得しており、ロボット制御についての知識があります。