
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか:Anthropic の新モデル Claude Fable 5 が FrontierMath ベンチマークで高い精度を記録しました。最難関のティア4で88%の正答率に達し、同じティアで約75%の GPT-5.5 を大きく上回っています。このモデルは Epoch AI の標準テストで最大推論努力設定で評価されました。
なぜ重要か:Anthropic のモデルが数学問題を解く能力で急速に向上しています。前モデルの Opus 4.5 は2026年初頭にティア4で10%未満だったのに対し、わずかな期間で大きく改善されました。FrontierMath はAI の数学推論能力を測る最難関ベンチマークとして広く認識されており、Fable 5 の成績はこのベンチマークでの実力が本物であることを示唆しています。
注目点:これらの数学能力の向上は単なるベンチマーク上の改善ではなく、実例としても表れています。最近、OpenAI のモデルが長年未解決だった Erdős 問題を解き、Claude Mythos も同じく解いています。
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加





200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応