Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种统一框架RCMSTR,结合关系对比学习与掩码图像建模,解决场景文本识别中的语义先验利用问题。通过将文本元素间的关系重新解释为自监督标签,显著提升了表示学习质量,超越了现有自监督技术的识别性能。

🎯

关键要点

  • 本研究提出了一种统一框架RCMSTR,结合关系对比学习与掩码图像建模。
  • 该框架解决了场景文本识别中的语义先验利用问题。
  • 通过将文本元素间的关系重新解释为自监督标签,显著提升了表示学习质量。
  • RCMSTR在多种评估协议下展现出优异的识别性能,超越了现有自监督技术。
➡️

继续阅读