AIToday

AIの効率化が急速に進む中、ほとんどのタスクはクラウドの高性能モデルではなく、安価でローカルで動作するモデルで十分になりつつあります。

Hacker News3日前3分で読める
AIの効率化が急速に進む中、ほとんどのタスクはクラウドの高性能モデルではなく、安価でローカルで動作するモデルで十分になりつつあります。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    何が起きたか:Stanford の研究によると、ローカルモデルはチャットや推論のクエリの71.3%に正確に答えられるようになり、2023年の23.2%から大幅に向上しました。同時に、Coinbase の Brian Armstrong は「80%のワークロードが12~18ヶ月以内に99%安価なモデルで動作するようになる」と指摘しており、効率的なAI利用の時代が到来しています。

  2. 2

    なぜ重要か:現在、企業はクラウドの高度なモデルを過度に活用しており、Brian Armstrong の比喩を借りれば「心臓外科医に血圧測定をさせている」状況です。ローカル・オープンソース・安価なモデルで十分なタスクが大多数を占める一方、最先端モデルは本当に高度な処理が必要な場合に限定することで、コストと消費電力を大幅に削減できるとみられます。

  3. 3

    注目点:Uber は割り当てトークン予算を4ヶ月で使い切ったため、エンジニアに月次予算を配分する仕組みに切り替えています。Stanford の研究が提示した「ワット当たりのインテリジェンス」という指標により、企業は各タスクに最適なモデルへのルーティングを判断できるようになる見通しです。

ディスカッション

この記事のディスカッションはまだありません

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →