该研究提出了一种基于CNN的新型架构,可以进行端到端的训练,以提供无缝的场景分割结果。该网络结构采用了一种新颖的分割头,将多尺度特征与上下文信息进行了无缝整合,从而预测一致的语义分割和检测结果。研究人员还提出了一种替代panoptic度量的方法,通过在三个具有挑战性的街景数据集上测试,该网络架构取得了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。