
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →Microsoftの技術論文によると、MAIモデルの訓練に Common Crawl などの公開されたウェブソースが使用された。Microsoftは以前、訓練データが「エンタープライズグレード、クリーンで商業的にライセンスされたデータ」のみであると主張していた
Microsoftは訓練データを「公開入手可能かつライセンスされた人間が生成したデータの混合」と説明している。ウェブデータに関しては、「Robots Exclusion Protocol(robots.txt)および関連するメタタグとHTMLコントロールに対応した独自のクローラー」を使用していると述べている
他のAI企業と同様に、Microsoftはウェブスクレイピングで一般的にされているのと同じ慣行に依存していると考えられる。公正利用の法的解釈は争われており、裁判所がこれを整理している途中である
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加





200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応