AIToday

Anthropic の Claude Fable 5 が数学問題ベンチマークで OpenAI の GPT-5.5 を大きく上回る成績を達成しました。

THE DECODER2時間前2分で読める
Anthropic の Claude Fable 5 が数学問題ベンチマークで OpenAI の GPT-5.5 を大きく上回る成績を達成しました。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    何が起きたか:Anthropic の新モデル Claude Fable 5 が FrontierMath ベンチマークで高い精度を記録しました。最難関のティア4で88%の正答率に達し、同じティアで約75%の GPT-5.5 を大きく上回っています。このモデルは Epoch AI の標準テストで最大推論努力設定で評価されました。

  2. 2

    なぜ重要か:Anthropic のモデルが数学問題を解く能力で急速に向上しています。前モデルの Opus 4.5 は2026年初頭にティア4で10%未満だったのに対し、わずかな期間で大きく改善されました。FrontierMath はAI の数学推論能力を測る最難関ベンチマークとして広く認識されており、Fable 5 の成績はこのベンチマークでの実力が本物であることを示唆しています。

  3. 3

    注目点:これらの数学能力の向上は単なるベンチマーク上の改善ではなく、実例としても表れています。最近、OpenAI のモデルが長年未解決だった Erdős 問題を解き、Claude Mythos も同じく解いています。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →