尝试使用MinerU

尝试使用MinerU

💡 原文中文,约1800字,阅读约需5分钟。
📝

内容提要

MinerU在公式识别上有所进步,但仍存在汉字识别错误和漏识别标点的问题。与PaddleOCR-VL相比,MinerU在特殊符号识别上更准确,但速度较慢。总体而言,DeepSeek-OCR在排版和复杂公式识别方面表现最佳。

🎯

关键要点

  • MinerU在公式识别上有所进步,但仍存在汉字识别错误和漏识别标点的问题。
  • 与PaddleOCR-VL相比,MinerU在特殊符号识别上更准确,但速度较慢。
  • DeepSeek-OCR在排版和复杂公式识别方面表现最佳。
  • MinerU在识别公式中的汉字和多行公式时存在多种问题。
  • 新版MinerU使用vLLM部署后准确率提高到90+。
  • MinerU在识别速度上比PaddleOCR-VL慢约17%。
  • MinerU对特殊数学符号的识别准确率高于PaddleOCR-VL和DeepSeek-OCR。
  • MinerU和PaddleOCR-VL都存在无法正确区分题目序号和公式部分的问题。
  • DeepSeek-OCR在排版和复杂公式识别方面的优势明显,但模型较大,速度较慢。
  • PaddleOCR-VL在公式混合排版的输出顺序上存在问题。

延伸问答

MinerU在公式识别方面有哪些进步和问题?

MinerU在公式识别上有所进步,但仍存在汉字识别错误和漏识别标点的问题。

MinerU与PaddleOCR-VL相比有什么优势和劣势?

MinerU在特殊符号识别上更准确,但速度较慢,且存在一些识别错误;PaddleOCR-VL在公式混合排版的输出顺序上存在问题。

如何安装新版MinerU以提高识别准确率?

可以通过使用vLLM部署新版MinerU,安装命令为 'pip install "mineru[all]"',然后运行相应的命令进行识别。

DeepSeek-OCR在OCR模型中表现如何?

DeepSeek-OCR在排版和复杂公式识别方面表现最佳,但模型较大,速度较慢。

MinerU在识别速度上与PaddleOCR-VL相比如何?

MinerU的识别速度比PaddleOCR-VL慢约17%。

MinerU在识别公式时存在哪些具体问题?

MinerU在识别公式时经常无法识别汉字、漏识别公式部分、识别错误字母和标点符号等问题。

➡️

继续阅读