Anthropic の Claude Fable 5 が数学問題ベンチマークで OpenAI の GPT-5.5 を大きく上回る成績を達成しました。

THE DECODER2026年6月13日LINEで送る

こういう要約が、毎朝あなたのメールに届きます。

3つのポイント

何が起きたか
Anthropic の新モデル Claude Fable 5 が FrontierMath ベンチマークで高い精度を記録しました。最難関のティア4で88%の正答率に達し、同じティアで約75%の GPT-5.5 を大きく上回っています。このモデルは Epoch AI の標準テストで最大推論努力設定で評価されました。
なぜ重要か
Anthropic のモデルが数学問題を解く能力で急速に向上しています。前モデルの Opus 4.5 は2026年初頭にティア4で10%未満だったのに対し、わずかな期間で大きく改善されました。FrontierMath はAI の数学推論能力を測る最難関ベンチマークとして広く認識されており、Fable 5 の成績はこのベンチマークでの実力が本物であることを示唆しています。
注目点
これらの数学能力の向上は単なるベンチマーク上の改善ではなく、実例としても表れています。最近、OpenAI のモデルが長年未解決だった Erdős 問題を解き、Claude Mythos も同じく解いています。

AIが要約して、あなたの選んだトピックだけを1日1通。LINE・Email・Slackで届きます。

登録無料・30秒で完了・いつでも解除できます

まだコメントがありません。最初のコメントを投稿しましょう！

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

登録無料・30秒で完了・いつでも解除できます