AIToday

Anthropic は、AI モデル Fable 5 の安全対策による拒否・ダウングレードを目に見える形で表示することを約束し、当初の非透明性への批判に応じました。

Fortune AI10時間前3分で読める
Anthropic は、AI モデル Fable 5 の安全対策による拒否・ダウングレードを目に見える形で表示することを約束し、当初の非透明性への批判に応じました。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    何が起きたか:Anthropic は最高性能モデル Fable 5 をリリースしましたが、先端 AI 開発関連のリクエストを無通知でダウングレードする安全対策が 319 ページの安全文書に埋もれていたため、AI 研究者から批判を受けました。同社は水曜日、フラグされたリクエストが Opus 4.8 へのフォールバックを目に見えるようにし、API では拒否理由を返すと発表しました。

  2. 2

    なぜ重要か:Anthropic は当初、ユーザーに対して安全対策が適用されていることを隠していました。同社は利用規約で競争 AI システムの構築を禁止しているほか、米国と同盟国のチップ製造優位性を維持するため外国への AI 能力向上を防ぎたいと述べており、AI 開発と国防上の懸念の板挟みにある状況を露呈させています。

  3. 3

    注目点:Anthropic は先月 IPO に機密申請しており、安全性を重視する企業というブランド戦略と、安全対策の透明性不足という初期判断のズレが市場での信用に影響する可能性があります。同社は「バランスを間違えたことを謝罪する」と述べています。

ディスカッション

この記事のディスカッションはまだありません

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →