HB-net:全面爆发细胞群集集成网络用于遮挡多目标识别
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种简单而强大的方法来识别场景文本,使用基于全局特征引导注意力的二维卷积神经网络和序列解码器。相比循环神经网络,训练时仅使用单词级别的注释,能够在前向和后向传递中获得1.3x至9.4x不等的加速。在评估的正常和不规则的场景文本基准数据集上实现了最先进或竞争性的识别性能。
🎯
关键要点
- 提出了一种基于全局特征引导注意力的二维卷积神经网络和序列解码器的方法来识别场景文本。
- 训练时仅使用单词级别的注释。
- 相比循环神经网络,前向和后向传递中获得1.3x至9.4x的加速。
- 在正常和不规则的场景文本基准数据集上实现了最先进或竞争性的识别性能。
➡️