文本区域多信息感知网络用于场景文本检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新算法用于场景文本检测,通过一组策略提高文本定位质量。与EAST集成后,在保持快速运行速度的同时,达到了竞争性能。

🎯

关键要点

  • 本研究提出了一种用于场景文本检测的新算法。

  • 提出了一组策略显著提高文本定位质量。

  • 引入了文本特征对齐模块(TFAM),动态调整特征的感受域。

  • 设计了位置感知非极大值抑制模块(PA-NMS),集中于可靠的原始检测。

  • 提出了实例 IoU 损失,平衡不同比例文本实例的训练。

  • 通过消融研究证明了所提出策略的有效性和优越性。

  • 将这些策略与EAST集成,实现了快速运行速度和竞争性能。

➡️

继续阅读