本研究提出了一种名为TopFormer的移动友好架构,以不同尺度的Token作为输入,产生具有尺度感知的语义特征,并将这些特征注入到相应的Token中以增强表示能力。该方法在多个语义分割数据集上优于CNN和ViT网络,并在ARM移动设备上实现了比MobileNetV3更高的平均交并比精度,同时,TopFormer的微型版本可以在ARM移动设备上实时推断。
完成下面两步后,将自动完成登录并继续当前操作。