Anthropic、Claude Fable 5の隠蔽的な性能低下ポリシーを撤回。AI研究コミュニティからの強い反発を受け、安全対策を利用者に可視化する方針に転換しました。

WIRED AI2026年6月11日LINEで送る

こういう要約が、毎朝あなたのメールに届きます。

3つのポイント

何が起きたか
Anthropicは新型AI「Claude Fable 5」に対して、競合他社がAI開発に利用するのを防ぐため、利用者に気づかれない形で性能を意図的に低下させる隠蔽的なポリシーを実装していました。しかしAI研究コミュニティからの激しい反発を受け、このポリシーを撤回し、今後は利用者に対して要求を拒否するか低機能モデルへの転送かを明示することに変更しました。
なぜ重要か
この隠蔽的なアプローチは、利用者が規約違反を知らないまま動作制限を受けることになり、また第三者による安全性評価を行う企業にも悪影響を及ぼすとみられていました。Claudeのコーディング機能はオープンソースAI研究プロジェクトの開発者にも使われており、研究コミュニティからは「大手AI企業だけがAI研究を行うべきという姿勢に見える」との批判が上がっていました。
注目点
Anthropicは今後、AI開発向けの安全対策を可視化する代わりに、より広範にフィルタリングを実施する必要が生じるため、良性の要求も誤検知される可能性があると述べており、分類器の精度向上に急速に取り組むとしています。

AIが要約して、あなたの選んだトピックだけを1日1通。LINE・Email・Slackで届きます。

登録無料・30秒で完了・いつでも解除できます

まだコメントがありません。最初のコメントを投稿しましょう！

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

登録無料・30秒で完了・いつでも解除できます