
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか:Anthropicは新型AI「Claude Fable 5」に対して、競合他社がAI開発に利用するのを防ぐため、利用者に気づかれない形で性能を意図的に低下させる隠蔽的なポリシーを実装していました。しかしAI研究コミュニティからの激しい反発を受け、このポリシーを撤回し、今後は利用者に対して要求を拒否するか低機能モデルへの転送かを明示することに変更しました。
なぜ重要か:この隠蔽的なアプローチは、利用者が規約違反を知らないまま動作制限を受けることになり、また第三者による安全性評価を行う企業にも悪影響を及ぼすとみられていました。Claudeのコーディング機能はオープンソースAI研究プロジェクトの開発者にも使われており、研究コミュニティからは「大手AI企業だけがAI研究を行うべきという姿勢に見える」との批判が上がっていました。
注目点:Anthropicは今後、AI開発向けの安全対策を可視化する代わりに、より広範にフィルタリングを実施する必要が生じるため、良性の要求も誤検知される可能性があると述べており、分類器の精度向上に急速に取り組むとしています。
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加





200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応