本研究提出了FreeSplatter框架,解决了稀疏视图重建中相机姿态不足的问题。该框架通过无标定稀疏视图生成高质量三维表示,并快速恢复相机参数,优于现有方法。
本文介绍了DL3DV-10K数据集,包含来自10,510个视频的51.2百万帧,涵盖65种场景。研究评估了最新的NVS方法,强调了大规模数据集在学习三维表示中的重要性。同时,提出了ZeroNVS模型,成功解决了复杂场景下的新视图合成问题,表现优异。
本综述研究了语义感知的神经辐射场(NeRFs)在视觉场景理解中的应用,分析了250多篇论文。NeRFs能够推断三维表示、生成新视点和进行场景分割。研究介绍了HG3-NeRF、Gen-NeRF和GP-NeRF等多种改进方法,提升了几何和语义一致性,促进了三维场景理解。实验结果表明,这些方法在合成新视角和语义分割任务中优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。