通过大规模真实世界数据集和增强记忆变换器实现高保真文档去污
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了文档图像因污渍影响可读性和后续应用(如文档数字化和分析)的问题。提出了StainDoc数据集,该数据集具有5000多对污渍和干净文档图像,支持文档去污算法的训练和评估。通过创新的StainRestorer变换器模型,本研究在去污效果和保留文档内容完整性方面表现出显著优势,为文档去污设立了新基准。
本研究提出了StainDoc数据集,包含5000多对污渍与干净文档图像,旨在解决文档可读性问题。通过StainRestorer模型,显著提升了去污效果和内容完整性,为文档去污设立了新基准。