本文介绍了一种名为“Rooms from Motion”(RfM)的新方法,用于无姿态图像的室内3D物体检测。RfM通过基于图像的3D框替代传统的2D关键点匹配,能够估计相机姿态和物体轨迹,生成高质量的语义3D物体地图。与现有方法相比,RfM在定位性能和地图质量上表现优异,适用于增强现实和机器人等领域。
本研究提出Corr2Distrib,首个基于对应关系的方法,能够从RGB图像中估计6D相机姿态分布,有效解决视觉模糊引发的多种姿态问题,超越现有技术。
DynPose-100K是一个包含100,131个带相机姿态标注的动态视频数据集,旨在解决动态视频中的相机姿态估计问题,提供多样化的真实场景,推动视频生成和机器人技术的发展。
本研究提出了一种支架式SLAM方法,通过运动外观嵌入和频率正则化金字塔,显著提升了不同相机姿态下的3D图像质量。在TUM RGB-D数据集中,单目相机的映射质量提高了16.76%。
本研究提出LiftImage3D框架,解决单幅图像3D重建中的几何模糊和视角限制问题,确保生成帧的相机姿态校准与3D一致性,推动3D重建技术的应用。
本研究提出了一种基于深度神经网络的3D云检索系统,解决了固定太阳光照方向下云属性检索的不足。该系统适应不同相机姿态和太阳方向,通过多视角云强度图像和两阶段训练方法,显著提高了在太阳天顶角变化时的检索效果。
本文介绍了GS-SLAM算法,该算法首次在SLAM系统中应用3D高斯表示,显著提升了效率与准确性。通过自适应扩张策略和从粗到细的技术,优化了相机姿态和地图构建。实验结果表明,该方法在多个数据集上表现优异,源代码将在获批后发布。
本文介绍了一种概率方法,解决机器人视觉重定位中的重复结构问题。通过创新训练策略,该方法能预测图像的相机姿态后验分布,在存在歧义时表现优于现有方法,具有良好应用潜力。
本研究提出了一种新颖的基于物理的光度束调整方法,解决了非朗伯环境中的光度不一致性问题。该方法通过引入与材料、光照和光路径相关的权重,能够更准确地估计相机姿态和3D几何体,显示出优于现有方法的准确性。
本文介绍了多种改进神经辐射场(NeRF)的方法,如DietNeRF、BARF和HyperNeRF,旨在提升3D重建和视图合成的质量。这些方法在处理稀疏视图、优化相机姿态和新视角合成方面表现出色,显著提高了模型性能。
本文介绍了一种无监督自我监督方法,用于从单目内窥镜数据中估计深度,提升手术场景中的相机姿态估计和重建效果。研究提出了Endo-4DGS和EndoDAC等深度估计框架,结合光度线索和动态重建技术,显著提高内窥镜手术的准确性和效率。
本文介绍了GS-SLAM算法,该算法首次在SLAM系统中应用3D高斯表示,显著提升了效率和准确性。通过自适应扩张策略,GS-SLAM能够有效重构新场景几何,优化相机姿态,并减少运行时间。该方法在多个数据集上表现优异,具备高质量的3D重建和渲染能力。
该研究提出了一种新方法“空间和时间的视频外推”,结合自我监督学习和视频预测,提升了在真实环境中的表现。通过解耦3D结构和相机姿态,该方法实现了新视角合成和相机姿态估计,展现出更高的视觉质量和准确性。
本文介绍了多种基于神经辐射场(NeRF)的新方法,旨在提高三维重建和视觉定位的准确性与效率。这些方法包括:L2G-NeRF 解决相机对齐问题,PNeRFLoc 结合传统方法与NeRF,MVG-NeRF 提升表面质量,IR-NeRF 改善姿态估计,LU-NeRF 同时估计相机姿态和NeRF,GNeRF 结合生成对抗网络优化视角合成。这些方法在多个数据集上表现优异。
本文提出了一种新算法,通过2D平面图对全景RGBD扫描进行校准,显著减少所需扫描次数。该算法在五个大型室内空间上进行评估,利用多模态图像对应线索,避免堆叠偏差。同时,研究介绍了SPVLoc方法,能够准确定位查询图像的六维相机姿态,无需过多先验知识。实验结果表明,该方法在定位准确度和泛化性能上优于现有技术。
本文提出了一种改进的运动结构法(SfM)算法,能够在滚动快门影响下估计相对姿态,并提供9点算法复原相机姿态。研究了基于双重滚动快门的成像方法和自适应扭曲模型,展示了在动态场景中消除滚动快门效应的有效性。此外,提出了自监督训练的DRSC网络框架和基于深度学习的校正方法,均显示出优于现有技术的性能。
本文提出了一种基于运动指导的虚拟运动数据解析框架,旨在从动态模糊图像中恢复运动信息。通过双阶段分解网络和优化相机姿态,结合视觉惯性航位推测,显著提高了模糊图像的恢复质量,推动了3D场景重建的应用。
本文提出了一种基于深度注意力感知特征的视觉定位框架,可在自动驾驶中实现厘米级别的定位精度。通过使用新型端到端的深度神经网络,利用深度注意机制寻找显著、稳定性强的特征,以建立强鲁棒性的匹配,并成功估计高精度的相机姿态。经过大量的实验验证,证明了我们的方法在各种挑战性场景下,都能够达到非常具有竞争力的定位精度,这为未来自动驾驶的低成本定位解决方案提供了新的可能性。
本文介绍了一种新颖的网络训练方法,通过利用相对空间和时间几何约束来估计相机姿态。该方法在少量或非常稀疏的地面真实3D坐标可用的情况下进行定位,经过在三个视觉定位数据集上的评估,证明其优于其他姿态估计方法。
该研究提出了一种新的方法,通过学习预期的外观来进行术中患者到图像的注册,通过最小化术中图像与合成预期纹理之间的差异来估计相机姿态,提高注册精度。在神经导航背景下应用该方法,结果显示该方法优于现有方法,并达到了当前临床标准的准确性。
完成下面两步后,将自动完成登录并继续当前操作。