关系对比学习与掩码图像建模用于场景文本识别
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了统一框架RCMSTR,通过自监督标签重新解释文本元素间的关系,结合关系对比学习与掩码图像建模,显著提升了场景文本识别的性能。
🎯
关键要点
- 本研究提出了统一框架RCMSTR。
- RCMSTR通过自监督标签重新解释文本元素间的关系。
- 结合关系对比学习与掩码图像建模,显著提升了场景文本识别的性能。
- 解决了场景文本识别中的语义先验利用问题。
- 改善了表示学习质量。
- 在多种评估协议下展现出优异的识别性能,超过现有的自监督技术。
➡️