Microsoftが7つの新MAIモデルを発表、MAI-Thinking-1は推論とソフトウェア開発タスクに特化

Latent Space2026年6月3日

こういう要約が、毎朝あなたのメールに届きます。

3つのポイント

Microsoftは Build カンファレンスで、推論、コード、画像、音声文字起こし、音声生成にわたる7つのMAIモデルを発表。フラッグシップの MAI-Thinking-1 は35Bアクティブパラメータ MoE（複数の専門化したAIを組み合わせるモデル構造）で256Kコンテキストウィンドウを備える。
MAI-Thinking-1は合成データやサードパーティモデルからの蒸留を用いずに構築され、AIME 2025で97%、SWE-Bench Proで53%を達成。マイクロソフトは MAI-Image-2.5 が画像編集で Image Edit Arena #2（スコア1401）に達したと主張。
技術コミュニティは109ページのMAI技術報告書を高く評価。パイプラインの詳細、スケーリング手法、データキュレーション、インフラメトリクスを開示した透明性が「このスケールのモデルの中で最も透明なものの一つ」と指摘された。
MAI-Transcribe-1.5は ~276x realtime（実時間の約276倍の速度）と2.4% AA-WER で STT（音声文字起こし）フロンティアで #3ランク。43言語に対応し、$6 per 1,000 minutes of audio で Microsoft Foundry 経由で利用可能。

AIが要約して、あなたの選んだトピックだけを1日1通。LINE・Email・Slackで届きます。

登録無料・30秒で完了・いつでも解除できます

この記事のディスカッションはまだありません

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応