ENJA

ログイン毎日無料でニュースを受け取る

記事一覧に戻る大規模言語モデル

大規模言語モデル

Microsoftは新しいMAIモデルの訓練にライセンスされていないウェブデータを使用していた。以前は「エンタープライズグレード、クリーンで商業的にライセンスされたデータ」のみを使用していると主張していた

THE DECODER2026年6月5日

Microsoftは新しいMAIモデルの訓練にライセンスされていないウェブデータを使用していた。以前は「エンタープライズグレード、クリーンで商業的にライセンスされたデータ」のみを使用していると主張していた

こういう要約が、毎朝あなたのメールに届きます。

無料で登録 →

3つのポイント

Microsoftの技術論文によると、MAIモデルの訓練に Common Crawl などの公開されたウェブソースが使用された。Microsoftは以前、訓練データが「エンタープライズグレード、クリーンで商業的にライセンスされたデータ」のみであると主張していた
Microsoftは訓練データを「公開入手可能かつライセンスされた人間が生成したデータの混合」と説明している。ウェブデータに関しては、「Robots Exclusion Protocol（robots.txt）および関連するメタタグとHTMLコントロールに対応した独自のクローラー」を使用していると述べている
他のAI企業と同様に、Microsoftはウェブスクレイピングで一般的にされているのと同じ慣行に依存していると考えられる。公正利用の法的解釈は争われており、裁判所がこれを整理している途中である

こうしたAIニュースを毎朝無料で受け取る LINEで友だち追加して受け取る元記事を読む

「大規模言語モデル」の最新ニュースを、毎朝7時にお届けします

AIが要約して、あなたの選んだトピックだけを1日1通。LINE・Email・Slackで届きます。

無料で毎朝受け取る →LINEで友だち追加して受け取る

登録無料・30秒で完了・いつでも解除できます

ディスカッション

まだコメントがありません。最初のコメントを投稿しましょう！

ログインして議論に参加

関連記事

Samsung、Mistralへ10億ユーロ投資協議

DIGITIMES Asia1時間前

ITC InfotechがGoogle Cloudと提携、エンタープライズAI展開

Yahoo Finance AI1時間前

アリババ、チップからモデルまでAI帝国を構築

DIGITIMES Asia4時間前

ピチャイ氏、Gemini 3.5 Pro遅延で懸念に反論

Yahoo Finance AI4時間前

Alphabetが12四半期連続の二桁成長を達成

Yahoo Finance AI7時間前

AMDがAnthropicと数十億ドル規模のAIチップ契約を締結

Yahoo Finance AI11時間前

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める

登録無料・30秒で完了・いつでも解除できます

毎朝1分、AIの要点だけ。

200媒体以上・Email/LINE/Slack 対応

無料で受け取る →