AIToday

Anthropic、安全対策強化後にFable 5の全世界配信を再開

THE DECODER4時間前6分で読める
Anthropic、安全対策強化後にFable 5の全世界配信を再開

要点

Anthropicが安全性強化後にFable 5の全世界配信を再開しました。Amazon研究者が発見した安全機構の回避手法に対抗するため、99%以上の精度でその技術をブロックする新しい安全分類器を導入しています。同社は政府と協働しながら業界全体でジェイルブレーク対策の標準化を進める必要があると主張しており、米政府との協力体制をさらに強化していく方針です。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    米政府による2週間の使用禁止を経て、Anthropicは最新AIモデル「Fable 5」の全世界配信を再開しました。Claude Platform、Claude.ai、Claude Code、Claude Coworkで提供開始され、Pro・Max・Team・一部Enterprise プランは7月7日まで利用枠の50%まで無制限アクセスが可能です。

  • なぜ重要か

    Amazon研究者が見つけた安全機構の回避方法により政府が配信を一時停止していました。Anthropicは新しい安全分類器を導入し、当該技術をブロックする精度を99%以上に高めました。同社は「AIモデルを完全にジェイルブレーク耐性にするのはおそらく不可能」と認めつつ、業界全体で共有できるジェイルブレーク評価基準の構築を求めています。

  • 注目点

    改善された安全分類器は有害でないコード作業でも誤ってリクエストをブロックする可能性があり、前回の配信でユーザーから制限が厳しすぎるという指摘を受けていました。Anthropicはセキュリティ研究者向けの新HackerOneプログラムを立ち上げ、Fable 5向けのサイバージェイルブレーク報告を募集しています。

よくある質問

Fable 5はいつから、どのプランで使えますか?
本日からClause Platform、Claude.ai、Claude Code、Claude Coworkで配信開始されました。Pro・Max・Team・一部Enterprise プランは7月7日まで週間利用枠の50%まで無制限でアクセス可能で、その後は利用クレジットで課金されます。
何が原因で配信が一時停止されたのですか?
Amazon研究者がFable 5の安全ガードレールを回避する方法を見つけました。その後モデルは複数のソフトウェア脆弱性を特定し、一部ではそれらを悪用する方法を示すコードも生成してしまいました。
新しい安全対策にはどのような課題がありますか?
改善された安全分類器は危険なリクエストをより多くブロックする一方で、日常的なコーディングやデバッグ作業の無害なリクエストも誤ってブロックしやすくなっています。実際、前回の配信ではユーザーからモデルが制限しすぎだという苦情を受けていました。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →