AIToday

DeepSeekの高速化技術がNvidia新製品の採用判断を複雑化

Yahoo Finance AI14時間前5分で読める
DeepSeekの高速化技術がNvidia新製品の採用判断を複雑化

要点

DeepSeekがソフトウェアベースの推論高速化技術「DSpark」をオープンソース化し、生成速度を大幅に向上させました。Nvidiaは「Groq 3 LPX」という専用ハードウェアで同じ課題の解決を目指していますが、無料で提供されるソフトウェア解決策の登場により、顧客がこの追加ハードウェアに投資する判断がより難しくなるとみられます。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    DeepSeekが6月27日に推論速度を高める「DSpark」をリリースしました。小さなAIモデルが複数のトークンを提案し、大きなモデルが並行して検証することで、1回の処理で複数トークンを承認でき、生成速度を60~85%向上させています。同時にNvidiaはGPUと組み合わせる専用ハードウェア「Groq 3 LPX」を2026年下半期に出荷予定です。

  • なぜ重要か

    LLM推論は入力処理(プリフィル)と出力生成(デコード)の2段階に分かれ、デコードはメモリ集約的で速度が遅く、Nvidiaはこの課題を解決する専用ハードを売ることで追加収益を狙っています。しかしDSparkはソフトウェアで同じ課題に対応し、オープンソースで無料で使えるため、顧客がNvidiaの追加ハードウェアを購入する必要性が低下する可能性があります。

  • 注目点

    DeepSeekのMLA設計では、V3.2と比べてV4-Proがミリオントークン会話に必要なメモリを約10%に削減しており、ソフトウェア側での効率化が継続しています。LPX出荷は2026年下半期、AWとCerebasの協業による競合ソリューションも同じ時期の提供開始です。

よくある質問

DSparkはいつから使えますか?
DSparkは6月27日にリリースされ、DeepSeek-V4-FlashおよびV4-Proで本番環境で稼働中です。MITライセンスでオープンソース化されており、すでにQwenとGemmaモデル群にも拡張されています。
Groq 3 LPXはいつから購入できますか?
Groq 3 LPXは2026年下半期に初期顧客への出荷が予定されています。Vera Rubin NVL72 GPUシステムと組み合わせて使用される想定で、別途購入決定が必要です。
DSparkと従来のNvidiaのGPUとの違いは何ですか?
DSparkはソフトウェア側で投機的デコード(draft-and-verify)を実装し、汎用Rubin GPUだけで推論効率を高めます。一方LPXはハードウェア専用設計で、Rubin GPUに加えて購入する必要があります。DSparkはオープンソースで無料ですが、LPXは追加投資が必要です。

ディスカッション

この記事のディスカッションはまだありません

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →