Mistral AI 推出 OCR 模型服务

科技
3月10日

什么鬼

近日，法国 AI 开发商 Mistral 发布了 Mistral OCR 模型，专用于将复杂的 PDF 文档转化为 AI 模型易于处理的 Markdown 格式文件。

据介绍，Mistral OCR 不仅能够识别 PDF 中的文本，还能检测其中的插图和照片，并在输出文件中创建边界框。它在性能上超越了来自谷歌、微软和 OpenAI 的同类 API，处理包含数学表达式、高级布局或表格的复杂文档，以及非英语文档时表现更佳。由于专注于 OCR 功能，Mistral OCR 在速度上也具有优势。Mistral OCR 的输出结果默认为 Markdown 格式，这种格式已经广泛应用于 AI 训练，因此是输入其他 AI 模型进一步处理的理想格式。

Mistral OCR 以 API 形式提供，可通过 Mistral 自有平台或 AWS、Azure、Google Cloud Vertex 等合作平台接入，定价为每千页 1 美元。对数据安全有较高要求的企业可以申请本地部署。

利好利空