
Mistral AIが新しいOCR モデル「OCR 4」をリリースしました。従来のOCRと異なり、ドキュメント内の要素の位置や役割を自動判定し、信頼度スコアも提供します。ブラインドテストで競合製品を72%の割合で上回ったと発表されており、検索システムやAI エージェントでの活用が期待されます。
こういう要約が、毎朝あなたのメールに届きます。
無料で登録 →何が起きたか
Mistral AIがOCR 4を発表しました。PDFやWord、PowerPointから文字を読み取るだけでなく、各要素のページ上の位置や役割(タイトル、表、方程式、署名など)を判定します。また、認識した各単語やページに対する信頼度スコアも出力します。
なぜ重要か
OCR 4は170言語をサポートし、600以上のドキュメントを用いたブラインドテストで、独立した評価者から72%の割合で競合モデルより優先されたとのことです。ドキュメントを自動的に意味のあるセクションに分割できるため、検索システムやAIエージェントでの処理を効率化できる可能性があります。
注目点
OCR 4はAPI、Mistral Studio、Microsoft Foundryを通じて利用できます。料金は$4 per 1,000 pagesで、バッチモードの場合は$2です。
まだコメントがありません。最初のコメントを投稿しましょう!
ログインして議論に参加





200以上のソースから厳選したAIニュースを毎日無料でお届けします。
無料で始める登録無料・30秒で完了・いつでも解除できます
毎朝5分、AIの要点だけ。
200媒体以上・Email/LINE/Slack 対応