
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →Microsoftは Build カンファレンスで、推論、コード、画像、音声文字起こし、音声生成にわたる7つのMAIモデルを発表。フラッグシップの MAI-Thinking-1 は35Bアクティブパラメータ MoE(複数の専門化したAIを組み合わせるモデル構造)で256Kコンテキストウィンドウを備える。
MAI-Thinking-1は合成データやサードパーティモデルからの蒸留を用いずに構築され、AIME 2025で97%、SWE-Bench Proで53%を達成。マイクロソフトは MAI-Image-2.5 が画像編集で Image Edit Arena #2(スコア1401)に達したと主張。
技術コミュニティは109ページのMAI技術報告書を高く評価。パイプラインの詳細、スケーリング手法、データキュレーション、インフラメトリクスを開示した透明性が「このスケールのモデルの中で最も透明なものの一つ」と指摘された。
MAI-Transcribe-1.5は ~276x realtime(実時間の約276倍の速度)と2.4% AA-WER で STT(音声文字起こし)フロンティアで #3ランク。43言語に対応し、$6 per 1,000 minutes of audio で Microsoft Foundry 経由で利用可能。
この記事のディスカッションはまだありません
200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応