小红花·文摘

运动中的房间：无姿态室内3D物体检测作为定位与地图构建

Apple Machine Learning Research ·

本研究提出Corr2Distrib，首个基于对应关系的方法，能够从RGB图像中估计6D相机姿态分布，有效解决视觉模糊引发的多种姿态问题，超越现有技术。

Corr2Distrib: Transforming Blurry Correspondences into Reliable 6D Pose Distribution Predictions

BriefGPT - AI 论文速递 ·

DynPose-100K：大规模动态视频数据集与相机姿态

DEV Community ·

本研究提出了一种支架式SLAM方法，通过运动外观嵌入和频率正则化金字塔，显著提升了不同相机姿态下的3D图像质量。在TUM RGB-D数据集中，单目相机的映射质量提高了16.76%。

Bracket-based SLAM: Structured 3D Gaussian for Simultaneous Localization and Realistic Mapping

BriefGPT - AI 论文速递 ·

本研究提出LiftImage3D框架，解决单幅图像3D重建中的几何模糊和视角限制问题，确保生成帧的相机姿态校准与3D一致性，推动3D重建技术的应用。

LiftImage3D：利用视频生成先验将任意单一图像提升为3D高斯

BriefGPT - AI 论文速递 ·

本研究提出了一种基于深度神经网络的3D云检索系统，解决了固定太阳光照方向下云属性检索的不足。该系统适应不同相机姿态和太阳方向，通过多视角云强度图像和两阶段训练方法，显著提高了在太阳天顶角变化时的检索效果。

DNN-based 3D Cloud Retrieval for Variable Solar Illumination and Multiview Spaceborne Imaging

BriefGPT - AI 论文速递 ·

本文介绍了GS-SLAM算法，该算法首次在SLAM系统中应用3D高斯表示，显著提升了效率与准确性。通过自适应扩张策略和从粗到细的技术，优化了相机姿态和地图构建。实验结果表明，该方法在多个数据集上表现优异，源代码将在获批后发布。

LGU-SLAM：可学习的高斯不确定性匹配与可变相关采样用于深度视觉 SLAM

BriefGPT - AI 论文速递 ·

本文介绍了一种概率方法，解决机器人视觉重定位中的重复结构问题。通过创新训练策略，该方法能预测图像的相机姿态后验分布，在存在歧义时表现优于现有方法，具有良好应用潜力。

Conditional Variational Autoencoders for Probabilistic Pose Regression

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的基于物理的光度束调整方法，解决了非朗伯环境中的光度不一致性问题。该方法通过引入与材料、光照和光路径相关的权重，能够更准确地估计相机姿态和3D几何体，显示出优于现有方法的准确性。

Physically-Based Photometric Bundle Adjustment in Non-Lambertian Environments

BriefGPT - AI 论文速递 ·

本文介绍了多种改进神经辐射场（NeRF）的方法，如DietNeRF、BARF和HyperNeRF，旨在提升3D重建和视图合成的质量。这些方法在处理稀疏视图、优化相机姿态和新视角合成方面表现出色，显著提高了模型性能。

TrackNeRF：通过特征轨迹从稀疏和噪声视图中优化NeRF

BriefGPT - AI 论文速递 ·

本文介绍了一种无监督自我监督方法，用于从单目内窥镜数据中估计深度，提升手术场景中的相机姿态估计和重建效果。研究提出了Endo-4DGS和EndoDAC等深度估计框架，结合光度线索和动态重建技术，显著提高内窥镜手术的准确性和效率。

基于几何建模的增强规模感知单目内窥镜场景深度估计

BriefGPT - AI 论文速递 ·

本文介绍了GS-SLAM算法，该算法首次在SLAM系统中应用3D高斯表示，显著提升了效率和准确性。通过自适应扩张策略，GS-SLAM能够有效重构新场景几何，优化相机姿态，并减少运行时间。该方法在多个数据集上表现优异，具备高质量的3D重建和渲染能力。

朝向实时高斯喷洒：通过光度 SLAM 加速 3DGS

BriefGPT - AI 论文速递 ·

该研究提出了一种新方法“空间和时间的视频外推”，结合自我监督学习和视频预测，提升了在真实环境中的表现。通过解耦3D结构和相机姿态，该方法实现了新视角合成和相机姿态估计，展现出更高的视觉质量和准确性。

通过解耦的三维场景表示预测未来视角的视频

BriefGPT - AI 论文速递 ·

本文介绍了多种基于神经辐射场（NeRF）的新方法，旨在提高三维重建和视觉定位的准确性与效率。这些方法包括：L2G-NeRF 解决相机对齐问题，PNeRFLoc 结合传统方法与NeRF，MVG-NeRF 提升表面质量，IR-NeRF 改善姿态估计，LU-NeRF 同时估计相机姿态和NeRF，GNeRF 结合生成对抗网络优化视角合成。这些方法在多个数据集上表现优异。

GeoNLF: 基于几何引导的无姿态神经激光雷达场

BriefGPT - AI 论文速递 ·

本文提出了一种新算法，通过2D平面图对全景RGBD扫描进行校准，显著减少所需扫描次数。该算法在五个大型室内空间上进行评估，利用多模态图像对应线索，避免堆叠偏差。同时，研究介绍了SPVLoc方法，能够准确定位查询图像的六维相机姿态，无需过多先验知识。实验结果表明，该方法在定位准确度和泛化性能上优于现有技术。

SALVe: 稀疏全景图的平面图重建的语义对齐验证

BriefGPT - AI 论文速递 ·

本文提出了一种改进的运动结构法（SfM）算法，能够在滚动快门影响下估计相对姿态，并提供9点算法复原相机姿态。研究了基于双重滚动快门的成像方法和自适应扭曲模型，展示了在动态场景中消除滚动快门效应的有效性。此外，提出了自监督训练的DRSC网络框架和基于深度学习的校正方法，均显示出优于现有技术的性能。

带有中间畸变流估计的卷帘快门校正

BriefGPT - AI 论文速递 ·

本文提出了一种基于运动指导的虚拟运动数据解析框架，旨在从动态模糊图像中恢复运动信息。通过双阶段分解网络和优化相机姿态，结合视觉惯性航位推测，显著提高了模糊图像的恢复质量，推动了3D场景重建的应用。

带有交互快门指导的运动模糊分解

BriefGPT - AI 论文速递 ·

本文提出了一种基于深度注意力感知特征的视觉定位框架，可在自动驾驶中实现厘米级别的定位精度。通过使用新型端到端的深度神经网络，利用深度注意机制寻找显著、稳定性强的特征，以建立强鲁棒性的匹配，并成功估计高精度的相机姿态。经过大量的实验验证，证明了我们的方法在各种挑战性场景下，都能够达到非常具有竞争力的定位精度，这为未来自动驾驶的低成本定位解决方案提供了新的可能性。

基于外观和运动的挑战性条件下的全球局部微型飞行器检测

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的网络训练方法，通过利用相对空间和时间几何约束来估计相机姿态。该方法在少量或非常稀疏的地面真实3D坐标可用的情况下进行定位，经过在三个视觉定位数据集上的评估，证明其优于其他姿态估计方法。

从姿态中隐式学习场景几何用于全局定位

BriefGPT - AI 论文速递 ·

该研究提出了一种新的方法，通过学习预期的外观来进行术中患者到图像的注册，通过最小化术中图像与合成预期纹理之间的差异来估计相机姿态，提高注册精度。在神经导航背景下应用该方法，结果显示该方法优于现有方法，并达到了当前临床标准的准确性。

用于追踪、注册、标签化和验证光学组织测量的点投影映射系统

BriefGPT - AI 论文速递 ·