NeRF-MAE: 自监督三维表示学习的遮罩自动编码器用于神经辐射场
原文中文,约700字,阅读约需2分钟。发表于: 。神经场在计算机视觉和机器人技术中表现出色,能够理解三维视觉世界,例如推断语义、几何和动态。我们使用神经场进行自监督预训练,尤其是使用遮盖的自动编码器从 RGB 图像生成有效的三维表示,然后将标准的三维视觉 Transformer 应用于 NeRF 来进行特定形式的训练。我们利用 NeRF 的体积网格作为 Transformer...
神经场在计算机视觉和机器人技术中表现出色。使用神经场进行自监督预训练,生成有效的三维表示。利用NeRF的体积网格作为Transformer的输入,通过遮盖NeRF的辐射和密度网格的随机补丁,使模型学习完整场景的语义和空间结构。NeRF-MAE自监督预训练方法在各种三维任务上表现出色,提升绝对性能超过20%和8%。