本文提出了一种新的注视模型,用于语义分割。该模型使用多尺度和上下文特征进行预测,并通过骨骼卷积神经网络框架输入不同尺度的表示。模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权,并添加了一个重新校准分支来重新校准每个类别的分数图。实验结果表明,该模型在PASCAL VOC 2012和ADE20K数据集上取得了有竞争力的结果。
完成下面两步后,将自动完成登录并继续当前操作。