AIToday

Anthropicが「控えめだが実質的な改善」と述べるClaude Opus 4.8をリリース。ほとんどのベンチマークでGPT-5.5とGemini 3.1 Proを上回る

THE DECODER5日前3分で読める
Anthropicが「控えめだが実質的な改善」と述べるClaude Opus 4.8をリリース。ほとんどのベンチマークでGPT-5.5とGemini 3.1 Proを上回る

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    Claude Opus 4.8はアジェント型コーディング(SWE-Bench Pro)で69.2%を達成し、前世代のOpus 4.7の64.3%およびGPT-5.5の58.6%を上回った。また多分野推論(Humanity's Last Exam)ではツールなしで49.8%、ツール使用時で57.9%のスコアを記録

  2. 2

    新機能「dynamic workflows」により、モデルは単一セッション内で数百の並列サブエージェントを起動できるようになり、数十万行のコードベース全体のマイグレーションに対応可能に。同時に「effort control」で応答の計算量を調整でき、「high」「extra」「max」の3段階から選択できる

  3. 3

    Fast Modeの価格が従来の3分の1に低下し、input tokensで$10 per million、output tokensで$50 per millionに。標準価格(input $5 per million、output $25 per million)は変わらず。GDPval-AAベンチマークではOpus 4.8がOpus 4.7比で15%少ないパスで済み、出力トークンは35%削減

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →