本文基于Ba等人(2014)的循环神经网络模型,研究细粒度分类任务。通过使用强大的视觉网络替代传统RNN,并在大规模预训练下进行训练,模型效果优于谷歌网络,能够自主区分狗的品种,具备端对端训练的优势。
本文研究了在无约束视觉环境下的细粒度分类任务,通过使用强大的视觉网络替代传统的RNN结构,并在大规模预训练的情况下训练模型,成功实现了比谷歌网络分类模型更好的效果。该模型能够自主学习并区分各类狗的品种,无需边界框等空间监督,具备端对端训练的优势。
完成下面两步后,将自动完成登录并继续当前操作。