AIToday

OpenAI、GPT-5.6 Sol発表 Claude Mythosに対抗、政府規制下で限定提供

THE DECODER3時間前5分で読める
OpenAI、GPT-5.6 Sol発表 Claude Mythosに対抗、政府規制下で限定提供

要点

OpenAIが新型モデルGPT-5.6 Solを発表し、コード生成ベンチマークでAnthropicのClaude Mythosを上回るスコアを達成しました。米政府の指示で当面はパートナー企業のみへの限定提供となっていますが、同社はこうした政府規制による制限は長期的には望ましくないと主張しています。Solは少ないトークン使用量で競合と同等の性能を実現するため、AI導入の費用効率を改善する可能性があります。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    OpenAIが新型モデル「GPT-5.6 Sol」を発表しました。エージェント(自分で判断して作業するAI)によるコード生成ではClaude Mythos 5を上回り、Terminal-Bench 2.1で88.8%のスコアを獲得しています。当面は米政府の指示に基づき、APIとCodexを通じて限られたパートナーのみが利用できます。

  • なぜ重要か

    OpenAIは「政府アクセスプロセスが長期的なデフォルトになるべきではない」と述べ、規制による提供制限への不満を明言しています。同時にSolは従来世代より少ないトークン(AIの処理単位)で競争相手と同等以上の性能を発揮するとされており、AI導入コストの上昇傾向に対する反論となる可能性があります。

  • 注目点

    価格は100万トークンあたりSolが入力$5・出力$30、下位のLunaが入力$1・出力$6に設定されています。7月にはCerebras(クラウド処理基盤)での提供が1秒あたり750トークンのスピードで開始予定です。

よくある質問

GPT-5.6 Solはいつから誰でも使えますか?
現在、APIとCodexを通じて限定的なパートナーのみが利用でき、米政府の指示に基づいています。7月にはCerebrasでの提供が開始される予定ですが、広く一般向けに開放されるかは明記されていません。
利用料金はいくらですか?
100万トークンあたりSolは入力$5・出力$30です。下位モデルのTerraは入力$2.50・出力$15、Lunaは入力$1・出力$6となっています。
Claude Mythosとの主な違いは?
Terminal-Bench 2.1のコード生成ベンチマークではSolが88.8%でMythos 5の88%を上回っています。一方、ExploitBenchというセキュリティテストではSolがMythosと同等の性能を発揮しながら、出力トークンは約3分の1に削減されています。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →