Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-Distillation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种克洛兹自蒸馏方法,解决了场景文本识别中编码器与解码器扩展不足的问题。通过上下文感知的软预测和伪标签,显著提升了解码器性能,并在11个基准测试中取得了最先进的效果,同时降低了参数和计算成本。
🎯
关键要点
- 本研究提出了一种克洛兹自蒸馏方法,解决了场景文本识别中编码器与解码器扩展不足的问题。
- 通过上下文感知的软预测和伪标签,显著提升了解码器性能。
- 在11个基准测试中取得了最先进的效果,同时降低了参数和计算成本。
- 研究发现解码器的扩展显著优于编码器的扩展,提升了整体性能。
➡️