オープンAI、GPT-5をリリース　推論モデルを統合

かねてから注目されていたオープンAIの新しい大規模言語モデル「GPT-5」がついにリリースされた。サム・アルトマンCEOは「AGIへの重要な一歩」と胸を張るが、実際にはユーザー体験のいくつかの改善にとどまっている。 by Grace Huckins2025.08.08

ついに、オープンAI（OpenAI）がGPT-5を発表した。新システムでは、オープンAIの主力モデルと推論（Reasoning）モデル「oシリーズ」との区別が廃止され、ユーザーのクエリは、高速な非推論モデルか、より遅い推論モデルのいずれかに自動的に振り分けられる。現在、チャットGPT（ChatGPT）のウェブインターフェースを通じて、誰でも利用可能である。ただし、無料ユーザーが新機能を完全に利用できるようになるまでには、数日かかる可能性がある。

GPT-5をGPT-4という明確な前身と比較したくなるが、より本質的に重要なのは、昨年リリースされたオープンAI初の推論モデル「o1」との比較である。GPT-5が幅広く展開されているのとは対照的に、o1は当初、有料版（プラスおよびチームプラン）の利用者にのみ提供されていた。これらのユーザーは、最終的な回答を出す前に追加のテキストを生成して「推論」するという、まったく新しいタイプの言語モデルにアクセスできるようになり、非推論モデルでは太刀打ちできない難問の解決が可能になった。

o1が大きな技術的飛躍だったのに対し、GPT-5は何よりもまず洗練された製品である。記者説明会で、サム・アルトマンCEOはGPT-5をアップルのRetina（レティナ）ディスプレイに例えたが、それは彼の意図とは異なる意味で適切な比喩だったかもしれない。かつてないほど鮮明なスクリーンのように、GPT-5はより快適でシームレスなユーザー体験を提供するだろう。それは無意味ではないが、アルトマンCEOが過去1年にわたり強調してきた、変革的なAIの未来にはほど遠い。説明会でアルトマンCEOはGPT-5を「AGI（汎用人工知能）への道のりにおける重要な一歩」と表現したが、仮にそうだとしても、それはごく小さな一歩に過ぎない。

オープンAIがMITテクノロジーレビューに事前に公開したデモを例に見てみよう。オープンAIの事後学習責任者であるヤン・デュボワは、パートナーが家族とより円滑にコミュニケーションを取れるようにフランス語を学ぶためのWebアプリケーションをGPT-5に設計させた。モデルは指示に見事に従い、魅力的でユーザーフレンドリーなアプリを作成した。しかし、私がGPT-4oにほぼ同じプロンプトを与えたところ、まったく同じ機能を持つアプリを生成した。唯一の違いは、見た目の美しさに欠けていた点だ。

その他のユーザー体験の改善のいくつかは、より実質的なものである。各クエリに推論を適用するかどうかをユーザーではなくモデルが選択することで、特にLLMの進歩を密接にフォローしていないユーザーにとって、大きな問題点が取り除かれる。

さらにアルトマンCEOによれば、GPT-5はoシリーズモデルよりもはるかに高速に推論を実行するという。オープンAIがこれを無料ユーザーにも提供しているという事実は、同社にとって運用コストが低いことを示している。これは非常に重要な点である。強力なモデルを安価かつ迅速に実行することは困難な課題であり、その解決はAIの環境負荷を軽減する鍵となる。

オープンAIは、長年の課題であった幻覚（ハルシネーション）を抑えるための対策も講じている。同社の評価によれば、GPT-5は前世代のo3やGPT-4oに比べて、誤った主張をする可能性が大幅に低いという。それが事実であれば、より信頼性が高く、安全なエージェントの実現につながる可能性がある。「ハルシネーションは、実際の安全性やセキュリティ上の問題を引き起こす可能性があります」。カリフォルニア大学バークレー校のドーン・ソング教授（コンピューター科学）は述べている。例えば、実在しないソフトウェア・パッケージをハルシネーションで提示し、悪意あるコードをダウンロードしてしまう危険がある。

GPT-5は、エージェント機能のテストやコーディング評価であるSWE-BenchおよびAider Polyglot（エイダー・ポリグロット）など、複数のベンチマークで最先端の性能を達成した。しかし、ハギングフェイス（HuggingFace）のAI研究者クレマンティーヌ・フーリエによれば、これらの評価は飽和状態に近づいており、現在のモデルがすでに限界近くの性能に達していることを示しているという。

「これは基本的に、高校生が中学生レベルの問題に取り組んでいるようなものです。もし高校生が失敗すれば、それは何かを示しているが、成功しても得られる情報は少ない」。フーリエは、システムがSWE-Benchで80％または85％のスコアを達成すれば印象的だと語ったが、実際には74.9％にとどまった。

最終的に、オープンAIが伝えたい主なメッセージは、GPT-5の使い心地が向上したということである。「このモデルの雰囲気は本当に良くて、とくに普段モデルのことを考えていない一般の人たちが、それを実感すると思います」。ChatGPTのニック・ターリー製品責任者は語った。

しかし、「雰囲気」だけでは、アルトマンが約束した自動化された未来を実現することはできない。推論は、汎用人工知能への道のりにおける大きな前進に感じられた。我々は今もなお、その次の段階を待ち望んでいる。

人気の記事ランキング

グレース・ハッキンズ [Grace Huckins]米国版 AI担当記者: 最先端の機械学習研究から、チャットボットの社会的・倫理的影響に至るまで、幅広いテーマを取材。スタンフォード大学で神経科学の博士号を取得。

オープンAI、GPT-5をリリース 推論モデルを統合

オープンAI、GPT-5をリリース　推論モデルを統合