AIToday

Claude Fable 5、安全機能強化で性能スコア低下 復帰後に2社が調査

ITmedia AI+2日前5分で読める
Claude Fable 5、安全機能強化で性能スコア低下 復帰後に2社が調査

要点

Anthropicの「Claude Fable 5」が7月1日に提供を再開しましたが、脆弱性対応で安全機能が強化された結果、性能評価が企業によって異なります。BridgeMind AIはコーディング関連のスコアが大幅に低下したと報告する一方、ユーザー評価サイト「Arena」はほぼ変わらないと報告しており、安全機能強化の実際の影響について判断が分かれています。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    Anthropicの「Claude Fable 5」が7月1日に提供を再開しました。脆弱性対応のため安全機能の分類器がアップデートされ、有害な指示を自動検知してより性能の低いモデルに処理を切り替える仕組みが強化されています。

  • なぜ重要か

    開発企業BridgeMind AIの調査では、デバッグ性能が86.2から25.9に、リファクタリングが73.6から38.4に低下するなど、コーディング関連のベンチマークスコアが大きく落ちています。一方、ユーザー評価サイト「Arena」の調査では提供停止前後でほぼ変わっていないとの報告もあり、評価が分かれています。

  • 注目点

    BridgeMind AIはモデルそのものの性能は落ちておらず、安全機能の強化に伴い日常的なリクエストの誤検出が増えたことが原因と分析しています。Arena.aiは今回のスコアを暫定値としており、より詳細な分析結果を公開する予定です。

よくある質問

Claude Fable 5が提供停止になった理由は何ですか?
脆弱性が見つかったとの報告をきっかけに、6月12日に米政府の命令によって提供が一時停止されました。7月1日に脆弱性に対応した分類器をアップデートして再開しています。
BridgeMind AIの調査で性能が低下した理由は何ですか?
モデルそのものの性能は落ちていませんが、安全機能の強化に伴い、日常的なコーディングやデバッグ作業における無害なリクエストを誤検出する頻度が増えたことが原因です。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →