星辰文档解析依托前沿的多模态融合算法,攻克图像及PDF等复杂格式的识别与解析难题。产品集成文字识别、高精表格还原、版面逻辑分析及语义阅读语序重构等多项核心能力,实现了对文档逻辑结构的高精度还原。其通过构建坚实的底层解析底座,为企业级知识问答、AI Agent建设及大规模文档数据治理提供强有力的技术赋能。
OCRbenchV2 权威榜单中文榜单第一,获 ICDAR2026-Sci-ImageMiner 文档 OCR 理解顶会 Data Extraction Task 冠军。
支持电子PDF、扫描版PDF、PNG、JPG、WEBP、BMP格式文档。
支持检出多种常见版面元素类型,包括段落、标题、表格、图片、公式、印章、页眉、页脚等。
支持检出手写体、公式元素类型。手写体以文本形式返回,公式以latex语法返回。
支持识别文档中的表格,包括有线表、无线表,以及跨行跨列、合并单元格等特殊情形,表格识别结果支持以HTML格式返回。