FastTextSpotter:一种高效的多语言场景文本检测变换器
💡
原文中文,约2100字,阅读约需5分钟。
📝
内容提要
本研究提出了FastTextSpotter框架,结合Swin Transformer和Transformer编码-解码架构,提高OCR中的场景文本识别准确率和处理速度。实验结果显示该框架在多语言场景文本的检测和识别方面表现出色。
🎯
关键要点
- 本研究提出了FastTextSpotter框架,结合Swin Transformer和Transformer编码-解码架构。
- 该框架通过更快的自注意力单元SAC2提升处理速度并保持准确性。
- 实验结果显示FastTextSpotter在多语言场景文本的检测和识别方面表现出色。
- FastTextSpotter在准确率和模型效率上树立了新标杆。
➡️