量子位 ·

全球OCR新王来自中国开源！GitHub狂揽73300+Star

💡 原文中文，约4900字，阅读约需12分钟。

📝

内容提要

百度的PaddleOCR在GitHub上获得73300+星标，超越谷歌的Tesseract OCR，成为全球OCR项目的领军者。这标志着中国在OCR领域的首次领先。PaddleOCR依托深度学习和文心大模型，实现了快速增长，用户遍及160个国家，支持110种语言，推动了OCR技术的广泛应用。

🎯

关键要点

百度的PaddleOCR在GitHub上获得73300+星标，超越谷歌的Tesseract OCR，成为全球OCR项目的领军者。
PaddleOCR依托深度学习和文心大模型，实现了快速增长，用户遍及160个国家，支持110种语言。
PaddleOCR的登顶标志着中国在OCR领域的首次领先，推动了OCR技术的广泛应用。
PaddleOCR与文心大模型之间形成双向赋能，提升了文本提取和理解能力。
PaddleOCR-VL和PaddleOCR-VL-1.5模型在文档解析评测中表现优异，获得全球第一。
PP-OCRv5模型通过数据优化策略实现了小参数模型的高效性能，超越了大模型。
OCR技术正在成为大模型数据生态的基础，推动信息获取与处理能力的提升。
未来OCR的竞争将更加深入，可能会向场景化和端云协同方向发展。

❓

延伸问答

PaddleOCR是如何在GitHub上获得73300+星标的？

PaddleOCR通过深度学习和文心大模型的支持，实现了快速增长，最终超越了谷歌的Tesseract OCR，成为全球OCR项目的领军者。

PaddleOCR支持多少种语言？

PaddleOCR支持110种语言，用户遍及160个国家。

PaddleOCR与文心大模型之间有什么关系？

PaddleOCR与文心大模型之间形成双向赋能，提升了文本提取和理解能力，推动了PaddleOCR的快速发展。

PP-OCRv5模型有什么特别之处？

PP-OCRv5模型通过数据优化策略实现了小参数模型的高效性能，能够在多种场景下超越大模型。

OCR技术在未来的发展趋势是什么？

未来OCR的竞争将更加深入，可能会向场景化和端云协同方向发展。

PaddleOCR的用户群体有哪些？

PaddleOCR的用户群体包括全球开发者、企业用户及OCR上下游伙伴，覆盖160个国家。

🏷️

继续阅读

Claude手搓3D建筑编辑器火爆GitHub！数万年费的专业软件瑟瑟发抖
Pascal Editor是一款开源的3D建筑编辑器，用户可通过浏览器免费使用，具备强大的编辑功能和实时几何系统，支持2D与3D无缝联动，操作简单，适合室...
GitHub初学者指南：开始使用GitHub安全工具
本文介绍了GitHub的安全工具，如秘密扫描、Dependabot和代码扫描，帮助开发者识别和修复代码漏洞。通过使用GitHub高级安全功能，用户可以有效...
美国开源AI最后的旗帜，也倒了
艾伦人工智能研究所（Ai2）削减了对开源模型的资金支持，核心团队集体加盟微软，标志着美国开源AI的衰退。OLMo模型的开发受到影响，开源社区对此表示遗憾。...
上海AI实验室发布“AGI4S珠穆朗玛计划”，构建中国科学智能创新中枢
上海AI实验室推出“AGI4S珠穆朗玛计划”，旨在构建科学智能创新中心，支持全球科学家实现重大突破。该计划通过整合算力、数据和实验平台，促进科研资源协同，推动科学发现。
Nature Index特刊聚焦天立国际：系统呈现中国教育AGI实践探索
《自然》特刊关注天立国际在教育AGI领域的探索，强调认知建模与AI结合，推动教育公平与可持续发展。天立的AI系统已在107所学校应用，提升教育质量，助力学...
国产世界模型登顶全球第一！断层领先谷歌英伟达，3D准确度近满分
极佳视界的GigaWorld-1模型在WorldArena评测中获得全球第一，超越谷歌和英伟达，展现出在物理遵循、3D准确度和视觉质量方面的领先技术，推动...