AIToday

Cerebriumが分散ルーター「Thalamus」を公開——複数地域のGPUクラスタ間でリアルタイムAIリクエストをルーティング

Hacker News2日前2分で読める
Cerebriumが分散ルーター「Thalamus」を公開——複数地域のGPUクラスタ間でリアルタイムAIリクエストをルーティング

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

  1. 1

    Cerebriumは、複数の大陸にある複数のGPUプロバイダーのクラスタ間でAIワークロードをルーティングするためにThalusを構築した。同社の顧客アプリが複数のデータセンターに分散して実行される際に、どのクラスタがリクエストを処理すべきかを決定する必要があるため。

  2. 2

    Thalusはミリ秒単位の予算内で決定を下す。各クラスタ内の「cluster-aggregator」がローカル情報(スケール変動、稼働・予約容量、GPU種別、ヘルス、ノードコスト)を中央データストアに継続的にプッシュし、各Thamusインスタンスが局所キャッシュから読み取ることで、リモート呼び出しをホットパスから排除している。

  3. 3

    Thalusの決定により、顧客はどのクラスタでコードが実行されるかを管理する代わりに、配信に集中できる。ルーティング先を誤ると、リアルタイムテキスト音声変換リクエストなどの低遅延ワークロードでレイテンシ予算を超過し、顧客を失う可能性がある。

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう!

ログインして議論に参加

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝5分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →