本文介绍了一种名为“Rooms from Motion”(RfM)的新方法,用于无姿态图像的室内3D物体检测。RfM通过基于图像的3D框替代传统的2D关键点匹配,能够估计相机姿态和物体轨迹,生成高质量的语义3D物体地图。与现有方法相比,RfM在定位性能和地图质量上表现优异,适用于增强现实和机器人等领域。
本研究提出Corr2Distrib,首个基于对应关系的方法,能够从RGB图像中估计6D相机姿态分布,有效解决视觉模糊引发的多种姿态问题,超越现有技术。
DynPose-100K是一个包含100,131个带相机姿态标注的动态视频数据集,旨在解决动态视频中的相机姿态估计问题,提供多样化的真实场景,推动视频生成和机器人技术的发展。
本研究提出了一种支架式SLAM方法,通过运动外观嵌入和频率正则化金字塔,显著提升了不同相机姿态下的3D图像质量。在TUM RGB-D数据集中,单目相机的映射质量提高了16.76%。
本研究提出LiftImage3D框架,解决单幅图像3D重建中的几何模糊和视角限制问题,确保生成帧的相机姿态校准与3D一致性,推动3D重建技术的应用。
本研究提出了一种基于深度神经网络的3D云检索系统,解决了固定太阳光照方向下云属性检索的不足。该系统适应不同相机姿态和太阳方向,通过多视角云强度图像和两阶段训练方法,显著提高了在太阳天顶角变化时的检索效果。
本文介绍了GS-SLAM算法,该算法首次在SLAM系统中应用3D高斯表示,显著提升了效率与准确性。通过自适应扩张策略和从粗到细的技术,优化了相机姿态和地图构建。实验结果表明,该方法在多个数据集上表现优异,源代码将在获批后发布。
本文介绍了一种概率方法,解决机器人视觉重定位中的重复结构问题。通过创新训练策略,该方法能预测图像的相机姿态后验分布,在存在歧义时表现优于现有方法,具有良好应用潜力。
本研究提出了一种新颖的基于物理的光度束调整方法,解决了非朗伯环境中的光度不一致性问题。该方法通过引入与材料、光照和光路径相关的权重,能够更准确地估计相机姿态和3D几何体,显示出优于现有方法的准确性。
通过3D高斯喷洒方法,开发了一种无需相机姿态的稀疏视图合成的新构建和优化方法。使用单目深度和将像素投影回3D世界逐步构建解决方案,并通过检测训练视图与对应的渲染图像之间的2D对应关系,开发了一种统一可微的管道来完成相机注册和相机姿态与深度的调整。在数据集上展示了结果,显示出明显优于竞争方法的质量。
本文介绍了一种全球室内定位方法SPVLoc,无需现场特定先验知识和训练,能够准确确定查询图像的相机姿态。通过匹配过程,在室内环境的全景图中定位视口,成功实现了图像到全景图以及图像到模型的匹配。实验表明,该方法对未见过的场景具有很好的泛化性能,并且在定位准确度上优于现有方法。
本文研究了3D高斯喷洒(3DGS)中的误差源,包括模糊、相机姿态和颜色不一致性,并提出了改善鲁棒性的解决方案。实验证实了该方案在相关基准数据集上取得了最先进的结果。
本文提出了一种基于深度学习的方法,利用矩阵等变体结构实现了从大量图像集合中同时恢复相机姿态和三维场景结构。通过添加一个适应于处理异常值的内禀/外禀分类模块并添加一个鲁棒的捆绑调整步骤,我们的方法可以成功地应用于包含常见启发式方法提取的具有许多异常值的大型图像集合的现实场景。
本文研究了3D高斯喷洒(3DGS)中的误差源,包括模糊、相机姿态和颜色不一致性,并提出了改进方法。通过建模运动模糊和解决颜色不一致性,提高了3DGS的鲁棒性。实验证实了该方法在相关基准数据集上的性能改进。
本文提出了一种利用手持视频数据实现高质量场景重建的方法,通过建模物理图像形成过程和视觉惯性航位推测,优化相机姿态,减轻相机运动。实验证明该方法在减轻相机运动方面具有出色性能。
本文介绍了一种基于手持视频数据的高质量场景重建方法,利用视觉惯性航位推测估计速度,并考虑相机姿态的非静态性。通过建立可微的渲染流水线,将滚动快门和运动模糊效应纳入3DGS框架。实验证明,该方法在减轻相机运动方面具有出色性能,推动了3DGS在逼真场景中的应用。
本文提出了一种基于深度注意力感知特征的视觉定位框架,可在自动驾驶中实现厘米级别的定位精度。通过使用新型端到端的深度神经网络,利用深度注意机制寻找显著、稳定性强的特征,以建立强鲁棒性的匹配,并成功估计高精度的相机姿态。经过大量的实验验证,证明了我们的方法在各种挑战性场景下,都能够达到非常具有竞争力的定位精度,这为未来自动驾驶的低成本定位解决方案提供了新的可能性。
本文介绍了一种新颖的网络训练方法,通过利用相对空间和时间几何约束来估计相机姿态。该方法在少量或非常稀疏的地面真实3D坐标可用的情况下进行定位,经过在三个视觉定位数据集上的评估,证明其优于其他姿态估计方法。
该研究提出了一种新的方法,通过学习预期的外观来进行术中患者到图像的注册,通过最小化术中图像与合成预期纹理之间的差异来估计相机姿态,提高注册精度。在神经导航背景下应用该方法,结果显示该方法优于现有方法,并达到了当前临床标准的准确性。
该文介绍了一种新颖的方法,通过学习预期的外观来进行术中患者到图像的注册。该方法在脑外科手术中的神经导航背景下应用,优于现有方法,并达到了当前临床标准的准确性。
完成下面两步后,将自动完成登录并继续当前操作。