
DeepSeekがソフトウェアベースの推論高速化技術「DSpark」をオープンソース化し、生成速度を大幅に向上させました。Nvidiaは「Groq 3 LPX」という専用ハードウェアで同じ課題の解決を目指していますが、無料で提供されるソフトウェア解決策の登場により、顧客がこの追加ハードウェアに投資する判断がより難しくなるとみられます。
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか
DeepSeekが6月27日に推論速度を高める「DSpark」をリリースしました。小さなAIモデルが複数のトークンを提案し、大きなモデルが並行して検証することで、1回の処理で複数トークンを承認でき、生成速度を60~85%向上させています。同時にNvidiaはGPUと組み合わせる専用ハードウェア「Groq 3 LPX」を2026年下半期に出荷予定です。
なぜ重要か
LLM推論は入力処理(プリフィル)と出力生成(デコード)の2段階に分かれ、デコードはメモリ集約的で速度が遅く、Nvidiaはこの課題を解決する専用ハードを売ることで追加収益を狙っています。しかしDSparkはソフトウェアで同じ課題に対応し、オープンソースで無料で使えるため、顧客がNvidiaの追加ハードウェアを購入する必要性が低下する可能性があります。
注目点
DeepSeekのMLA設計では、V3.2と比べてV4-Proがミリオントークン会話に必要なメモリを約10%に削減しており、ソフトウェア側での効率化が継続しています。LPX出荷は2026年下半期、AWとCerebasの協業による競合ソリューションも同じ時期の提供開始です。
この記事のディスカッションはまだありません
200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝1分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応