小红花·文摘

本文提出了一种新的注视模型，用于语义分割。该模型使用多尺度和上下文特征进行预测，并通过骨骼卷积神经网络框架输入不同尺度的表示。模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权，并添加了一个重新校准分支来重新校准每个类别的分数图。实验结果表明，该模型在PASCAL VOC 2012和ADE20K数据集上取得了有竞争力的结果。