PP-ChatOCRv2赋能期刊出版,打造千家杂志社数字阅读新体验
原文中文,约3300字,阅读约需8分钟。发表于: 。在数字化阅读与期刊发行的交汇点上,杂志铺(http://www.zazhipu.com)以其庞大的在线订阅平台和卓越的期刊发行服务,已与3000多家杂志社建立合作,提供7000多种杂志,持续为500多万读者提供阅读资源。目前,杂志铺已经在线上、线下多渠道布局,并通过自有平台、App、官网以及各大电商平台、旗舰店等方式广泛触达读者。但在各类杂志内容深度理解和知识拓展方面,仍存在巨大的提升空间。尤其在...
杂志铺与3000多家杂志社合作,提供7000多种杂志,为500多万读者提供阅读资源。杂志铺计划构建一个SaaS系统,利用AI技术优化期刊的阅读助读和知识拓展功能。该系统基于飞桨,通过OCR技术帮助用户识别和扫描内容,实现了文章解读、作文批改、图片识别等功能。系统面临的难点包括复杂的版面布局、多样的杂志文档格式和版式、多语言支持以及阅读顺序恢复问题。为解决这些问题,杂志铺采用飞桨低代码开发工具中的文档场景信息抽取模型产线作为解决方案。经过模型训练和性能调优,最终版面分析模型的精度提升了11%。杂志铺表示,使用PaddleX工具大大节省了人力成本,提高了工作效率。