
Anthropicが安全性強化後にFable 5の全世界配信を再開しました。Amazon研究者が発見した安全機構の回避手法に対抗するため、99%以上の精度でその技術をブロックする新しい安全分類器を導入しています。同社は政府と協働しながら業界全体でジェイルブレーク対策の標準化を進める必要があると主張しており、米政府との協力体制をさらに強化していく方針です。
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか
米政府による2週間の使用禁止を経て、Anthropicは最新AIモデル「Fable 5」の全世界配信を再開しました。Claude Platform、Claude.ai、Claude Code、Claude Coworkで提供開始され、Pro・Max・Team・一部Enterprise プランは7月7日まで利用枠の50%まで無制限アクセスが可能です。
なぜ重要か
Amazon研究者が見つけた安全機構の回避方法により政府が配信を一時停止していました。Anthropicは新しい安全分類器を導入し、当該技術をブロックする精度を99%以上に高めました。同社は「AIモデルを完全にジェイルブレーク耐性にするのはおそらく不可能」と認めつつ、業界全体で共有できるジェイルブレーク評価基準の構築を求めています。
注目点
改善された安全分類器は有害でないコード作業でも誤ってリクエストをブロックする可能性があり、前回の配信でユーザーから制限が厳しすぎるという指摘を受けていました。Anthropicはセキュリティ研究者向けの新HackerOneプログラムを立ち上げ、Fable 5向けのサイバージェイルブレーク報告を募集しています。
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝1分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応