重新思考3D空间中辐射场的开放词汇分割
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
该研究提出了Open-NeRF,通过利用大规模的分割模型和层次嵌入,实现了从开放词汇中将神经辐射场分解为对象的挑战。实验结果表明,Open-NeRF在开放词汇的场景中胜过了其他方法。Open-NeRF为NeRF分解提供了一个有前途的解决方案,能够在开放世界的三维场景中实现新的机器人和视觉语言交互应用。
🎯
关键要点
- 该研究关注从开放词汇中将神经辐射场(NeRF)分解为对象的挑战。
- 提出了Open-NeRF,利用大规模的分割模型,如Segment Anything Model(SAM)。
- 引入集成和蒸馏范式,通过层次嵌入实现开放词汇查询的灵活性和三维分割的准确性。
- Open-NeRF生成分层的二维掩模提案,并通过跟踪方法对其进行对齐,最终蒸馏为三维场。
- 该过程确保不同视角下的对象一致识别和细粒度,适应遮挡和模糊特征的挑战性场景。
- 实验结果表明,Open-NeRF在开放词汇场景中优于LERF和FFD等最先进的方法。
- Open-NeRF为NeRF分解提供了有前途的解决方案,能够在开放世界的三维场景中实现新的机器人和视觉语言交互应用。
➡️