記事一覧に戻る

GPT-5.5は評価タスクで偏りを示す — 著者名と提示順序で判定が変わることが判明

Hacker News · 2026年4月25日

GPT-5.5は評価タスクで偏りを示す — 著者名と提示順序で判定が変わることが判明

AI要約

  • 研究者がOpenAIのGPT-5.5を複数の文章評価タスクでテストしたところ、同じ内容でも著者名が異なると異なる評価をし、また提示される順序によって判定が変わることが明らかになった。つまり、AIが客観的ではなく、人間や企業の名声に左右されるバイアス(偏り)を持っていることが実証された。
  • この偏りは、AIが「有名な著者の文章は質が高い」「最初に読んだものを高く評価する」といった学習パターンを無意識に持っていることを示している。AIが純粋に内容だけを見ているのではなく、文脈情報に大きく影響されるということ。
  • この結果は、AIを採用試験の採点、論文査読、コンテストの審査員として使おうとしている企業や教育機関にとって重要な警告になる。同じ応募者でも名前で差別されたり、提出タイミングで有利不利が決まったりする可能性があり、公正性が求められるタスクではGPT-5.5を単独の評価者として信頼できないことを示唆している。

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める