MSFormer:一种用于牙齿实例分割的骨架多视角融合方法
原文中文,约500字,阅读约需2分钟。发表于: 。基于深度学习的牙齿分割方法在数据收集和标注上耗时昂贵,本文提出了通过微调预训练的多视图模型实现高精度分割的解决方案,同时引入了 2D-3D 联合感知来改善分割结果,并使用骨架作为 3D 输入并结合 MSFormer 模型进行牙齿分割,实验结果表明,与训练数据量增加相关,该方法的分割准确率提高了 2.4%-5.5%。
AsymFormer是一种新型网络,用于实时RGB-D语义分割。该网络通过优化计算资源分配和引入非对称骨干网络,最小化冗余参数,以实现多模态特征的有效融合。使用局部关注引导特征选择(LAFS)模块,通过利用不同模态之间的依赖关系选择性地融合特征。在NYUv2和SUNRGBD数据集上评估该方法,AsymFormer在NYUv2上实现了52.0%的mIoU,在SUNRGBD上实现了49.1%的mIoU。在RTX3090上实现65 FPS的推理速度,在实施混合精度量化后,达到了79 FPS的推理速度。