本文介绍了一种基于相机视图位置编码(CAPE)的方法,解决多视图3D目标检测问题,实验结果表明其在NuScenes数据集上表现优异。此外,提出了多视角几何的3D物体检测方法VEDet和统一框架PETRv2,均在多任务学习和性能上取得显著提升。
该论文提出了一种几何一致的神经隐式表面重建方法,结合多视角几何约束和稀疏结构信息,优化有符号距离函数以实现高质量重建。实验结果表明,该方法在速度、泛化性能和灵活性方面表现优越。
本文介绍了一个使用计算代数和黎曼几何工具来分析多视角几何中最小问题的数值条件的通用框架。该方法可以评估条件数,去除离群值,并选择具有良好条件的图像数据。
本论文研究了从RGB视频中重建三维物体网格的方法,结合多视角几何和数据驱动方法来优化物体网格以适应多视角光度一致性,并通过形状先验来约束网格变形。作者采用逐片图像对齐的形式,通过光度误差更新形状参数,无需深度或掩膜信息。此外,作者还展示了如何通过虚拟视点的光栅化来避免零光度梯度导致的退化问题,并展示了采用光度网格优化的方法从合成和真实视频中获得的三维物体网格重建结果,相比于传统的网格生成网络或表面重建方法,避免了繁琐的手动后处理。
完成下面两步后,将自动完成登录并继续当前操作。