AIToday

Microsoftが自然言語でAIの動作テストを生成するオープンソースフレームワーク「ASSERT」を公開

TechCrunch AI9時間前3分で読める
Microsoftが自然言語でAIの動作テストを生成するオープンソースフレームワーク「ASSERT」を公開

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    Microsoftが火曜日、ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)という名称のオープンソースフレームワークを発表。AIモデルの期待される動作をプレーンテキストで記述すると、それを構造化された受け入れ可能/受け入れ不可の動作に変換し、問題シナリオとテストケースを生成して、ターゲットシステムに対して実行・スコア付けを行う。

  2. 2

    開発者は自然言語でAIシステムの目標、ポリシー、意図した動作を説明でき、ASERTが自動的にテストを生成。例として、文書調査AIエージェントが社外の人にメール送信しない、機密情報をC級経営者のみに制限するなどのルールを指定すると、ASERTがそのルールの遵守をチェックするテストケースを継続的に生成する。

  3. 3

    Microsoftの責任あるAI責任者Sarah Birdは、評価はシステムが組織の基準を満たしているかを理解するために「絶対に重要」であり、信頼性の高いシステムには「アプリケーション固有の多くの次元を評価すべき」と述べた。ASERTは構築時、デプロイ後、継続的な監視の段階で使用可能。

  4. 4

    この発表は、モデルが高度化するにつれ、研究者が反復的テストと回帰チェックに焦点を当てる業界全体の広がりの一環。StanfordのHELM、MLCommonsのAILuminate、METRなどの評価グループがモデルの異なる条件下での動作を測定するベンチマークを公開している。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →