AIToday

OpenAI、ChatGPT Proを3モデル体制に 強化版ベンチマーク論文で判明

THE DECODER3時間前4分で読める
OpenAI、ChatGPT Proを3モデル体制に 強化版ベンチマーク論文で判明

要点

OpenAIの研究論文が、ChatGPT Proの提供方法が大きく変わる可能性を示しました。従来は単一の最高級モデルだったProが、速度・スケール・性能の異なる3種類に分かれる見込みです。ベンチマークデータからは各版の性能差が確認できますが、実際の製品化はまだ決まっておらず、計算コストについての詳細も非公開です。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    OpenAIがゲノムベンチマーク論文を公開し、Pro版GPT-5.6が3つのバリアント(Luna Pro、Terra Pro、Sol Pro)で提供される可能性を示唆しました。従来のChatGPT Proは単一の最高級モデルでしたが、異なる速度・スケール・性能の3層構成に変わる見込みです。

  • なぜ重要か

    これまでProティアは「1つの高級オプション」でしたが、ユーザーが用途に応じて高速・高スループット・最高性能から選べる構造に変わる可能性があります。特にTerra Proは標準版Solとほぼ同等の性能(合格率28.5%)を示し、中堅層のビジネスユーザーにとって選択肢が増える意味合いが考えられます。

  • 注目点

    ベンチマーク結果によると、Sol Proの合格率は31.5%で、テスト対象60モデル中で最高性能を記録しました。ただしOpenAIはPro版の計算コスト(トークン使用量)に関するデータを公開していません。これが実際のChatGPTに実装されるかどうかは、論文だけからは明確ではありません。

よくある質問

Luna Pro、Terra Pro、Sol Proの3つは何が違うのですか?
Luna Proは高速で安価な日常的なクエリ向け、Terra Proは高スループットのビジネスワークロード向け、Sol Proは最難関タスク向けとされています。Luna Proは標準版からの向上幅が7ポイント、Sol Proは3ポイント未満と、弱いモデルほどPro化の利得が大きいことがわかっています。
Pro版はいつから使えますか?
論文ではベンチマークの結果表にPro版の記載が見られるだけで、実際のChatGPTでいつ提供されるかは明確ではありません。
Sol Proの性能はどのくらい高いのですか?
Sol Proの合格率は31.5%で、テスト対象60モデル中で最も高い性能を示しました。標準版Solの28.7%、Claude Opus 4.8の16.0%と比較すると、最高級モデルとしての差が見られます。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →