ENJA

ログイン毎日無料でニュースを受け取る

記事一覧に戻る大規模言語モデル

大規模言語モデル

Anthropicが「控えめだが実質的な改善」と述べるClaude Opus 4.8をリリース。ほとんどのベンチマークでGPT-5.5とGemini 3.1 Proを上回る

THE DECODER2026年5月28日

Anthropicが「控えめだが実質的な改善」と述べるClaude Opus 4.8をリリース。ほとんどのベンチマークでGPT-5.5とGemini 3.1 Proを上回る

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

Claude Opus 4.8はアジェント型コーディング（SWE-Bench Pro）で69.2%を達成し、前世代のOpus 4.7の64.3%およびGPT-5.5の58.6%を上回った。また多分野推論（Humanity's Last Exam）ではツールなしで49.8%、ツール使用時で57.9%のスコアを記録
新機能「dynamic workflows」により、モデルは単一セッション内で数百の並列サブエージェントを起動できるようになり、数十万行のコードベース全体のマイグレーションに対応可能に。同時に「effort control」で応答の計算量を調整でき、「high」「extra」「max」の3段階から選択できる
Fast Modeの価格が従来の3分の1に低下し、input tokensで$10 per million、output tokensで$50 per millionに。標準価格（input $5 per million、output $25 per million）は変わらず。GDPval-AAベンチマークではOpus 4.8がOpus 4.7比で15%少ないパスで済み、出力トークンは35%削減

こうしたAIニュースを毎朝無料で受け取る LINEで友だち追加して受け取る元記事を読む

「大規模言語モデル」の最新ニュースを、毎朝7時にお届けします

AIが要約して、あなたの選んだトピックだけを1日1通。LINE・Email・Slackで届きます。

無料で毎朝受け取る →LINEで友だち追加して受け取る

登録無料・30秒で完了・いつでも解除できます

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう！

ログインして議論に参加

関連記事

海軍、AI導入速度を優先し安全上のリスク受け入れ

THE DECODER1時間前

Anthropic、Claude Fable 5のProユーザーアクセスを制限

THE DECODER1時間前

研究者、プロンプトインジェクションをAI防御に活用

WIRED AI1時間前

EU、GoogleにAndroidと検索データ共有を命令

Yahoo Finance AI10時間前

UiPath初の黒字化、ServiceNowと競争激化

Yahoo Finance AI10時間前

Moonshot AI、K3でOpus 4.8超える 7月27日に2.8兆パラメータ公開へ

Daily Dose of Data Science10時間前

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →