AIの効率化が急速に進む中、ほとんどのタスクはクラウドの高性能モデルではなく、安価でローカルで動作するモデルで十分になりつつあります。

Hacker News3日前3分で読める

こういう要約が、毎朝あなたのメールに届きます。

3つのポイント

1
何が起きたか：Stanford の研究によると、ローカルモデルはチャットや推論のクエリの71.3%に正確に答えられるようになり、2023年の23.2%から大幅に向上しました。同時に、Coinbase の Brian Armstrong は「80%のワークロードが12～18ヶ月以内に99%安価なモデルで動作するようになる」と指摘しており、効率的なAI利用の時代が到来しています。
2
なぜ重要か：現在、企業はクラウドの高度なモデルを過度に活用しており、Brian Armstrong の比喩を借りれば「心臓外科医に血圧測定をさせている」状況です。ローカル・オープンソース・安価なモデルで十分なタスクが大多数を占める一方、最先端モデルは本当に高度な処理が必要な場合に限定することで、コストと消費電力を大幅に削減できるとみられます。
3
注目点：Uber は割り当てトークン予算を4ヶ月で使い切ったため、エンジニアに月次予算を配分する仕組みに切り替えています。Stanford の研究が提示した「ワット当たりのインテリジェンス」という指標により、企業は各タスクに最適なモデルへのルーティングを判断できるようになる見通しです。

この記事のディスカッションはまだありません

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応