多语言自然场景文本检测算法研究

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新算法用于场景文本检测,通过一组策略提高文本定位质量,并通过消融研究证明了策略的有效性。与EAST集成后,在保持快速运行速度的同时,达到了竞争性能。

🎯

关键要点

  • 本研究提出了一种用于场景文本检测的新算法。

  • 提出了一组策略显著提高文本定位质量。

  • 引入文本特征对齐模块(TFAM)动态调整特征的感受域。

  • 设计位置感知非极大值抑制模块(PA-NMS)集中于可靠的原始检测。

  • 提出实例 IoU 损失以平衡不同规模文本实例的训练。

  • 通过消融研究证明了策略的有效性和优越性。

  • 将策略与EAST集成,实现快速运行速度和竞争性能。

➡️

继续阅读