
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか:Stanford の研究によると、ローカルモデルはチャットや推論のクエリの71.3%に正確に答えられるようになり、2023年の23.2%から大幅に向上しました。同時に、Coinbase の Brian Armstrong は「80%のワークロードが12~18ヶ月以内に99%安価なモデルで動作するようになる」と指摘しており、効率的なAI利用の時代が到来しています。
なぜ重要か:現在、企業はクラウドの高度なモデルを過度に活用しており、Brian Armstrong の比喩を借りれば「心臓外科医に血圧測定をさせている」状況です。ローカル・オープンソース・安価なモデルで十分なタスクが大多数を占める一方、最先端モデルは本当に高度な処理が必要な場合に限定することで、コストと消費電力を大幅に削減できるとみられます。
注目点:Uber は割り当てトークン予算を4ヶ月で使い切ったため、エンジニアに月次予算を配分する仕組みに切り替えています。Stanford の研究が提示した「ワット当たりのインテリジェンス」という指標により、企業は各タスクに最適なモデルへのルーティングを判断できるようになる見通しです。
この記事のディスカッションはまだありません
200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応