AIToday

Anthropicが安全性ガードレール付きのMythosモデル版「Fable 5」を公開

Semafor Tech1日前2分で読める
Anthropicが安全性ガードレール付きのMythosモデル版「Fable 5」を公開

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    Anthropicは火曜日、同社の強力な未発表モデルMythosの公開版Fable 5をリリースした。サイバーセキュリティと生物学に関する質問への回答を防ぐガードレール(安全性対策)が施されている。

  2. 2

    Fable 5のガードレールはハッカーによるジェイルブレイク試行(安全性を回避する試み)に対して十分に強力かが問われている。Anthropicは「広範に」テストを実施し、安全装置を迂回しようとしたハッカーは成功しなかったと述べている。一方、Anthropicのより低性能なOpus 4.8モデルがそれらの質問に回答した。

  3. 3

    Anthropicは、ガードレール없는場合、Fable 5はソフトウェア脆弱性を発見・悪用する能力が「例外的に強力」であり、サイバー攻撃のコストを大幅に低下させる可能性があると認めている。

  4. 4

    初期テストでは、顧客はFable 5がソフトウェア公開に要する時間を大幅に短縮し、推論(AIが答えを導き出す処理)タスクで良好なパフォーマンスを示すと述べた。

ディスカッション

この記事のディスカッションはまだありません

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →