关系对比学习与掩码图像建模用于场景文本识别

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了统一框架RCMSTR,通过自监督标签重新解释文本元素间的关系,结合关系对比学习与掩码图像建模,显著提升了场景文本识别的性能。

🎯

关键要点

  • 本研究提出了统一框架RCMSTR。
  • RCMSTR通过自监督标签重新解释文本元素间的关系。
  • 结合关系对比学习与掩码图像建模,显著提升了场景文本识别的性能。
  • 解决了场景文本识别中的语义先验利用问题。
  • 改善了表示学习质量。
  • 在多种评估协议下展现出优异的识别性能,超过现有的自监督技术。
➡️

继续阅读