
VerizelのAI Gatewayが音声・リアルタイム通話機能をベータ版で提供開始しました。OpenAIとxAIのモデルに対応し、開発者は既存のテキスト・画像機能と同じ方法で音声通話、音声合成、音声認識をアプリケーションに統合できます。従来のように複数モデルを組み合わせる必要がなく、より自然な対話が実現する点が特徴です。
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか
Vercelの開発者向けプラットフォーム「AI Gateway」が音声・リアルタイム通話機能をベータ版で提供開始しました。OpenAIとxAIのモデルに対応し、テキストや画像と同じ方法で音声通話、音声合成、音声認識を利用できます。
なぜ重要か
これまでは音声認識→言語処理→音声合成という複数モデルのチェーンが必要でしたが、単一の音声モデルが直接音声を入出力するため、より自然な対話が実現します。音声アシスタントやカスタマーサポートなど、ユーザーが話しかける方が自然なアプリケーションを開発しやすくなります。
注目点
ベータ版はAI SDK 7で利用可能です。既存のAI Gatewayユーザーは同じAPI認証情報や支出管理機能を使いながら、新たに音声機能を追加できます。
この記事のディスカッションはまだありません
200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝1分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応