KADOKAWA Technology Review
×
【夏割】年間購読料が今なら20%オフ!お得なキャンペーン実施中
オープンAI、GPT-5をリリース 推論モデルを統合
Stephanie Arnett/MIT Technology Review | Adobe Stock, Envato
GPT-5 is here. Now what?

オープンAI、GPT-5をリリース 推論モデルを統合

かねてから注目されていたオープンAIの新しい大規模言語モデル「GPT-5」がついにリリースされた。サム・アルトマンCEOは「AGIへの重要な一歩」と胸を張るが、実際にはユーザー体験のいくつかの改善にとどまっている。 by Grace Huckins2025.08.08

ついに、オープンAI(OpenAI)がGPT-5を発表した。新システムでは、オープンAIの主力モデルと推論(Reasoning)モデル「oシリーズ」との区別が廃止され、ユーザーのクエリは、高速な非推論モデルか、より遅い推論モデルのいずれかに自動的に振り分けられる。現在、チャットGPT(ChatGPT)のウェブインターフェースを通じて、誰でも利用可能である。ただし、無料ユーザーが新機能を完全に利用できるようになるまでには、数日かかる可能性がある。

GPT-5をGPT-4という明確な前身と比較したくなるが、より本質的に重要なのは、昨年リリースされたオープンAI初の推論モデル「o1」との比較である。GPT-5が幅広く展開されているのとは対照的に、o1は当初、有料版(プラスおよびチームプラン)の利用者にのみ提供されていた。これらのユーザーは、最終的な回答を出す前に追加のテキストを生成して「推論」するという、まったく新しいタイプの言語モデルにアクセスできるようになり、非推論モデルでは太刀打ちできない難問の解決が可能になった。

o1が大きな技術的飛躍だったのに対し、GPT-5は何よりもまず洗練された製品である。記者説明会で、サム・アルトマンCEOはGPT-5をアップルのRetina(レティナ)ディスプレイに例えたが、それは彼の意図とは異なる意味で適切な比喩だったかもしれない。かつてないほど鮮明なスクリーンのように、GPT-5はより快適でシームレスなユーザー体験を提供するだろう。それは無意味ではないが、アルトマンCEOが過去1年にわたり強調してきた、変革的なAIの未来にはほど遠い。説明会でアルトマンCEOはGPT-5を「AGI(汎用人工知能)への道のりにおける重要な一歩」と表現したが、仮にそうだとしても、それはごく小さな一歩に過ぎない。

オープンAIがMITテクノロジーレビューに事前に公開したデモを例に見てみよう。オープンAIの事後学習責任者であるヤン・デュボワは、パートナーが家族とより円滑にコミュニケーションを取れるようにフランス語を学ぶためのWebアプリケーションをGPT-5に設計させた。モデルは指示に見事に従い、魅力的でユーザーフレンドリーなアプリを作成した。しかし、私がGPT-4oにほぼ同じプロンプトを与えたところ、まったく同じ機能を持つアプリを生成した。唯一の違いは、見た目の美しさに欠けていた点だ。

その他のユーザー体験の改善のいくつかは、より実質的なものである。各クエリに推論を適用するかどうかをユーザーではなくモデルが選択することで、特にLLMの進歩を密接にフォローしていないユーザーにとって、大きな問題点が取り除かれる。

さらにアルトマンCEOによれば、GPT-5はoシリーズモデルよりもはるかに高速に推論を実行するという。オープンAIがこれを無料ユーザーにも提供しているという事実は、同社にとって運用コストが低いことを示している。これは非常に重要な点である。強力なモデルを安価かつ迅速に実行することは困難な課題であり、その解決はAIの環境負荷を軽減する鍵となる。

オープンAIは、長年の課題であった幻覚(ハルシネーション)を抑えるための対策も講じている。同社の評価によれば、GPT-5は前世代のo3やGPT-4oに比べて、誤った主張をする可能性が大幅に低いという。それが事実であれば、より信頼性が高く、安全なエージェントの実現につながる可能性がある。「ハルシネーションは、実際の安全性やセキュリティ上の問題を引き起こす可能性があります」。カリフォルニア大学バークレー校のドーン・ソング教授(コンピューター科学)は述べている。例えば、実在しないソフトウェア・パッケージをハルシネーションで提示し、悪意あるコードをダウンロードしてしまう危険がある。

GPT-5は、エージェント機能のテストやコーディング評価であるSWE-BenchおよびAider Polyglot(エイダー・ポリグロット)など、複数のベンチマークで最先端の性能を達成した。しかし、ハギングフェイス(HuggingFace)のAI研究者クレマンティーヌ・フーリエによれば、これらの評価は飽和状態に近づいており、現在のモデルがすでに限界近くの性能に達していることを示しているという。

「これは基本的に、高校生が中学生レベルの問題に取り組んでいるようなものです。もし高校生が失敗すれば、それは何かを示しているが、成功しても得られる情報は少ない」。フーリエは、システムがSWE-Benchで80%または85%のスコアを達成すれば印象的だと語ったが、実際には74.9%にとどまった。

最終的に、オープンAIが伝えたい主なメッセージは、GPT-5の使い心地が向上したということである。「このモデルの雰囲気は本当に良くて、とくに普段モデルのことを考えていない一般の人たちが、それを実感すると思います」。ChatGPTのニック・ターリー製品責任者は語った。

しかし、「雰囲気」だけでは、アルトマンが約束した自動化された未来を実現することはできない。推論は、汎用人工知能への道のりにおける大きな前進に感じられた。我々は今もなお、その次の段階を待ち望んでいる。

人気の記事ランキング
  1. This startup wants to use the Earth as a massive battery 「逆さま揚水発電」で長期蓄電、米スタートアップが実証
  2. The vibe coding’s impact: How AI-driven development is transforming the tech industry バイブコーディングの衝撃——AI駆動開発が迫るIT業界の大転換
  3. The deadly saga of the controversial gene therapy Elevidys 遺伝子治療薬「エレビディス」が安全性問題で出荷停止、広がる波紋
グレース・ハッキンズ [Grace Huckins]米国版 寄稿者
フリーランスの科学ジャーナリスト。スタンフォード大学の博士候補生(神経科学)。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る