
Bridgewaterとその提携企業が、金融文書評価タスクでOpenAIのGPTやGoogleのGeminiといったフロンティアモデルをテストしたところ、専門家が作成したプロンプトでも精度は70%台半ばに留まりました。一方、Bridgewater投資家の判断で再学習したオープンソースモデルは84.7%の精度を達成し、実行コストは約14倍安いという結果が出ました。これは大手AI企業が企業の機密データを持っていないことを示し、企業が自社データを保護しながらAIを改善する可能性を浮き彫りにしています。
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか
Bridgewater傘下のAIA LabsとThinking Machines Labが、金融文書の関連性判定タスクでOpenAIやGoogleのフロンティアモデルを試験したところ、基本的なプロンプトでは約50%の精度に留まりました。一方、専門家が作成したプロンプトと3段階評価システムを組み合わせると精度は70%台半ばに上昇しましたが、著者らが設定した80%の信頼できるデプロイメント基準には達しませんでした。
なぜ重要か
Bridgewater傘下の投資家の判断を使ってファインチューニング(再学習)したオープンウェイトモデルが84.7%の精度を達成し、最高のフロンティアモデルの78.2%を上回ったうえ、実行コストは約14倍安くなりました。これは大手AIラボが企業の機密データや専門知識をすべて取り込んでいないことを示唆しており、自社データを保有したまま改善する道筋が存在することを意味します。
注目点
ファインチューニングはThinking Machines Labの「Tinker」プラットフォーム上で行われ、オープンモデルのQwen3-235Bをベースに使用しました。同社はOpenAIの元CTO Mira Muratiが創業した企業です。
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝1分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応