記事一覧に戻る

大規模言語モデルのツール使用エージェントが組織環境で実行する際の行動パターンを測定する新しい評価手法が提案される

arXiv cs.AI · 2026年4月15日

大規模言語モデルのツール使用エージェントが組織環境で実行する際の行動パターンを測定する新しい評価手法が提案される

AI要約

  • LLMベースのツール拡張エージェントが実行層でどのように振る舞うかを測定する新しいアプローチを導入
  • A-R空間(行動率と拒否信号の2次元空間)を使用し、言語シグナルと実行可能な動作の構造的関係を分析
  • 4つの規範的制度(制御、グレーゾーン、ジレンマ、悪意)と3つの自律性設定(直接実行、計画、省察)でモデルを評価
  • 集約的な安全スコアではなく、文脈的枠組みとスキャフォルディングの深さに応じて実行と拒否がどのように変わるかを特性化

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める