LUDVIG:无学习的2D视觉特征提升至高斯点云场景
发表于: 。本研究解决了将2D视觉模型的视觉特征或语义掩码提升至由高斯点云表示的3D场景的问题。通过一个简单而有效的聚合技术,我们的提升方法在与“Segment Anything”(SAM)的语义掩码应用中,实现了与当前最先进技术相当的分割质量。尽管DINOv2未经过数百万标注掩码的训练,我们的方法仍能通过图扩散整合3D场景几何结构,实现具有竞争力的分割结果。
本研究解决了将2D视觉模型的视觉特征或语义掩码提升至由高斯点云表示的3D场景的问题。通过一个简单而有效的聚合技术,我们的提升方法在与“Segment Anything”(SAM)的语义掩码应用中,实现了与当前最先进技术相当的分割质量。尽管DINOv2未经过数百万标注掩码的训练,我们的方法仍能通过图扩散整合3D场景几何结构,实现具有竞争力的分割结果。