HyperAI超神经 ·

在线教程｜DeepSeek-OCR 2公式/表格解析同步改善，以低视觉token成本实现近4%的性能跃迁

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

DeepSeek-AI推出的DeepSeek-OCR 2通过新架构DeepEncoder V2，解决了文档OCR中的布局解析和语义对齐问题，显著提升了文档理解准确率，尤其在公式和表格解析方面表现突出。

🎯

🔎

DeepSeek-OCR 2采用的DeepEncoder V2架构，通过引入LLM风格的视觉编码，显著提升了文档解析的准确性。这种新方法不仅解决了传统模型在复杂文档处理中的局限性，还使得模型能够更好地理解语义关系，提升了公式和表格的解析能力。

在OmniDocBench v1.5基准测试中，DeepSeek-OCR 2实现了91.09%的整体准确率，较前代提升3.73%。这种性能提升对于需要高精度文档处理的行业，如法律和金融，具有重要的实用价值，能够有效减少人工校对的时间和成本。

DeepSeek-OCR 2在保持16倍视觉token压缩率的同时，显著降低了在线服务的重复率。这意味着在资源受限的环境中，用户可以以更低的成本获得高效的文档OCR服务，适合中小企业和个人用户使用。

❓

DeepSeek-OCR 2的主要创新是采用了DeepEncoder V2架构，结合了双向注意力与因果注意力，提升了视觉token的语义驱动式重排能力。

DeepSeek-OCR 2在公式解析准确率上提升了6.17%，表格理解性能提升了2.5%-3.05%。

DeepSeek-OCR 2通过引入因果流查询和语义重组视觉顺序，消除了传统模型的空间顺序偏见，使模型能够依据语义关系动态组织文本。

在OmniDocBench v1.5基准测试中，DeepSeek-OCR 2实现了91.09%的整体准确率，较前代提升了3.73%。

DeepSeek-OCR 2以更低的视觉token成本，提供了高精度文档OCR的性价比方案，适合资源受限的场景。

用户可以访问HyperAI超神经官网的教程板块，选择DeepSeek-OCR 2进行一键部署，按照步骤进行操作即可。

🏷️