DECDM:利用循环一致性扩散模型进行文档增强

基于扩散模型的光学字符识别(OCR)在自动文档处理和文档智能方面对文档图像质量非常依赖,研究提出了一种新的端到端文档级图像转换方法 DECDM 来解决现有方法的数据分离和隐私保护问题,该方法通过独立训练源和目标模型,消除了配对训练的限制,提高了性能的数量和质量的比较。

本文介绍了MDCDP模块,通过引入注意机制融合视觉和语义特征,解决了文本识别中的困难问题。实验结果表明CDistNet在具有挑战性的识别场景中优于最近的方法,并取得了最新的准确性。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文