本研究提出了一种简单但强大的方法来识别场景文本,使用全局特征引导注意力的二维卷积神经网络和序列解码器。该方法在训练时只使用单词级别的注释,能够获得较快的加速。在评估中,该方法在正常和不规则的场景文本上表现出最先进或竞争性的识别性能。
该研究提出了一种简单而强大的方法来识别场景文本,使用基于全局特征引导注意力的二维卷积神经网络和序列解码器。相比循环神经网络,训练时仅使用单词级别的注释,能够在前向和后向传递中获得1.3x至9.4x不等的加速。在评估的正常和不规则的场景文本基准数据集上实现了最先进或竞争性的识别性能。
完成下面两步后,将自动完成登录并继续当前操作。