AIToday

NVIDIAがGPU推論基盤をオープンソース化、マルチクラウド対応

Hacker News1日前5分で読める
NVIDIAがGPU推論基盤をオープンソース化、マルチクラウド対応

要点

NVIDIAがGPU推論ワークロード管理プラットフォーム・NVIDIA Cloud Functions(NVCF)をオープンソース化しました。複数地域・複数GPU型に対応し、Kubernetes上でリクエストをルーティング・スケーリングする仕組みを提供することで、企業が独自インフラでGPU計算をより柔軟に運用できる環境を整備します。

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  • 何が起きたか

    NVIDIAが NVIDIA Cloud Functions(NVCF)をオープンソース化しました。GPU加速ワークロードをKubernetesで管理・実行するプラットフォームで、複数地域のGPUクラスタ間でリクエストをルーティングしてスケーリングします。

  • なぜ重要か

    企業がGPU推論を自社インフラで運用する際、複数クラウド・複数GPU型対応やオートスケーリングといった複雑な要件を単一のコントロールプレーンで統括できるようになります。クラウドベンダーに依存しない選択肢が広がる可能性があります。

  • 注目点

    プロジェクトは現在四半期ごとの公開ロードマップ(GitHub issue #27)を公開しており、機能リクエストはGitHub Discussionsで受け付けています。LocalおよびmacOSでBazelを使った開発環境構築が可能です。

よくある質問

NVCFでサポートされるワークロード型は何ですか?
NVCFはFunction(推論やストリーミング等のサービス型GPU処理)とTask(バッチ推論、評価、ファインチューニング等のrun-to-completion型処理)の2つに対応しています。各々がコンテナ、またはHelmチャートとしてパッケージ化できます。
複数のGPUクラスタ間で自動スケーリングできますか?
はい。NVCFの主要機能として「Multi-cluster autoscaling」があり、複数クラスタ間でワークロードをゼロからマックスまでスケーリングできます。また混合GPU型をサポートし、異なるGPU要件に対応しています。
セキュリティ上の報告はどこにすればよいですか?
セキュリティ脆弱性はSECURITY.mdに記載されたプロセスに従って報告してください。公開のGitHub issueでは報告しないでください。

ディスカッション

この記事のディスカッションはまだありません

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →