MinerU

6天前发布 13 0 0

开源的端到端PDF文档解析和数据提取工具

收录时间:
2025-07-02

MinerU 是上海AI实验室开源的一款PDF智能提取工具。它能将PDF、网页、电子书等文档内容转换为机器可读的结构化数据,如Markdown或JSON格式。MinerU 集成了布局分析、OCR识别、表格提取等技术模块,可以精准捕捉文档中的文本、表格、图片、公式等元素并重构输出。例如将学术论文的PDF转为Markdown笔记,或将财报PDF中的表格导出为可计算的数据集。MinerU 广泛应用于知识库构建、AI训练数据准备、科研资料整理等场景,大幅提高了复杂文档处理的效率。

相关导航

暂无评论

none
暂无评论...