69 lines
10 KiB
Markdown
69 lines
10 KiB
Markdown
<div align="center" xmlns="http://www.w3.org/1999/html">
|
||
<!-- logo -->
|
||
<p align="center">
|
||
<img src="https://opendatalab.github.io/MinerU/images/MinerU-logo.png" width="300px" style="vertical-align:middle;">
|
||
</p>
|
||
</div>
|
||
|
||
<!-- icon -->
|
||
|
||
[](https://github.com/opendatalab/MinerU)
|
||
[](https://github.com/opendatalab/MinerU)
|
||
[](https://github.com/opendatalab/MinerU/issues)
|
||
[](https://github.com/opendatalab/MinerU/issues)
|
||
[](https://pypi.org/project/mineru/)
|
||
[](https://pypi.org/project/mineru/)
|
||
[](https://pepy.tech/project/mineru)
|
||
[](https://pepy.tech/project/mineru)
|
||
[](https://mineru.net/OpenSourceTools/Extractor?source=github)
|
||
[](https://www.modelscope.cn/studios/OpenDataLab/MinerU)
|
||
[](https://huggingface.co/spaces/opendatalab/MinerU)
|
||
[](https://colab.research.google.com/gist/myhloli/a3cb16570ab3cfeadf9d8f0ac91b4fca/mineru_demo.ipynb)
|
||
[](https://arxiv.org/abs/2409.18839)
|
||
[](https://arxiv.org/abs/2509.22186)
|
||
[](https://deepwiki.com/opendatalab/MinerU)
|
||
|
||
<div align="center">
|
||
<a href="https://trendshift.io/repositories/11174" target="_blank"><img src="https://trendshift.io/api/badge/repositories/11174" alt="opendatalab%2FMinerU | Trendshift" style="width: 250px; height: 55px;" width="250" height="55"/></a>
|
||
<!-- hot link -->
|
||
|
||
<p align="center">
|
||
🚀<a href="https://mineru.net/?source=github">MinerU 官网入口→✅ 免装在线版 ✅ 全功能客户端 ✅ 开发者API在线调用,省去部署麻烦,多种产品形态一键get,速冲!</a>
|
||
</p>
|
||
|
||
<!-- join us -->
|
||
|
||
<p align="center">
|
||
👋 join us on <a href="https://discord.gg/Tdedn9GTXq" target="_blank">Discord</a> and <a href="https://mineru.net/community-portal/?aliasId=3c430f94" target="_blank">WeChat</a>
|
||
</p>
|
||
</div>
|
||
|
||
## 项目简介
|
||
|
||
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
|
||
MinerU诞生于[书生-浦语](https://github.com/InternLM/InternLM)的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。
|
||
相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到[issue](https://github.com/opendatalab/MinerU/issues)提交问题,同时**附上相关PDF**。
|
||
|
||

|
||
|
||
|
||
## 主要功能
|
||
|
||
- 删除页眉、页脚、脚注、页码等元素,确保语义连贯
|
||
- 输出符合人类阅读顺序的文本,适用于单栏、多栏及复杂排版
|
||
- 保留原文档的结构,包括标题、段落、列表等
|
||
- 提取图像、图片描述、表格、表格标题及脚注
|
||
- 自动识别并转换文档中的公式为LaTeX格式
|
||
- 自动识别并转换文档中的表格为HTML格式
|
||
- 自动检测扫描版PDF和乱码PDF,并启用OCR功能
|
||
- OCR支持109种语言的检测与识别
|
||
- 支持多种输出格式,如多模态与NLP的Markdown、按阅读顺序排序的JSON、含有丰富信息的中间格式等
|
||
- 支持多种可视化结果,包括layout可视化、span可视化等,便于高效确认输出效果与质检
|
||
- 支持纯CPU环境运行,并支持 GPU(CUDA)/NPU(CANN)/MPS 加速
|
||
- 兼容Windows、Linux和Mac平台
|
||
|
||
|
||
## 使用指南
|
||
|
||
- [快速上手指南](./quick_start/index.md)
|
||
- [详细使用说明](./usage/index.md) |