小红花·文摘

具有显式3D建模的世界一致性视频扩散

Apple Machine Learning Research ·

该研究提出了一种新颖的自回归框架——生成空间变换器（GST），用于改善空间定位和视图预测任务的不足。通过联合优化相机姿态估计和新视图合成，模型显著提升了这两项任务的性能，强调了空间意识与视觉预测之间的内在关系。

Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction

BriefGPT - AI 论文速递 ·

本文提出了一种基于3D高斯函数的新视角合成方法，旨在实现高质量的实时1080p渲染。通过优化参数和开发可见性感知渲染算法，显著提高了训练效率和渲染质量，并探讨了动态视图合成和相机姿态估计的改进，展示了在多个数据集上的优越性能。

基于深度感知的少量视角新颖视图合成的3D高斯点云

BriefGPT - AI 论文速递 ·

本文探讨了多种相机姿态估计和视觉重定位方法，特别是利用深度神经网络和场景坐标回归技术。研究提出的模型如PixLoc和GSLoc，旨在提高复杂环境中的定位准确性和效率。通过结合特征学习、稀疏匹配和弱监督学习，这些方法在多个数据集上表现优于现有技术，展现出良好的应用前景。

HGSLoc：基于三维图形的启发式相机姿态精细化

BriefGPT - AI 论文速递 ·

本文研究了新视角合成和3D高斯喷溅技术，提出了GGRt和MVSplat等新方法，显著提升了相机姿态估计和视角合成的性能。通过优化算法和自增强策略，解决了稀疏输入和噪声问题，增强了模型的鲁棒性和效率。Splatt3R方法实现了无姿态的3D重建，具备优异的实时渲染能力。

稀疏视图下的单目6D姿态估计的对象高斯方法

BriefGPT - AI 论文速递 ·

本文介绍了多种基于深度神经网络的视图合成和图像重建方法，如NR-NeRF和LU-NeRF，强调了在动态场景和复杂环境下的相机姿态估计与渲染性能的提升。这些方法通过优化框架和新颖模型设计，实现了高质量的3D场景重建和新视角合成，并在实际数据集上表现优越。

通用物体作为少样本视图合成的姿态探针

BriefGPT - AI 论文速递 ·

本文探讨了神经渲染和新视角合成技术，提出了一种无需SfM预处理的方法，显著提升了视角合成和相机姿态估计的性能。研究展示了使用高效的3D高斯分割模型和混合Triplane-Gaussian表示在渲染速度和质量上的优势，并介绍了Splatter Image和MVSplat等新方法，强调了在多视图重建中的高效性和准确性。

Splatt3R：来自非校准图像对的零-shot高斯喷溠

BriefGPT - AI 论文速递 ·

本文提出了一种可微的非线性最小二乘框架，用于相机姿态估计中的不确定性处理，评估结果优于现有方法。同时，研究介绍了基于EPnP和DLS的PnP求解器，提升了机器人和AR/VR系统中的定位准确性。此外，提出了新颖的概率深度学习模型和姿态选择方法，有效解决了姿态估计中的误校准问题。

基于图像特征的位姿估计的概率参数估计器和校准度量

BriefGPT - AI 论文速递 ·

本文提出了多种相机姿态估计方法，通过简化多项式和利用几何约束，提高了计算速度和准确性。研究了曼哈顿框架、相对位姿估计及混合框架，实验结果表明新方法在复杂环境中优于现有技术，具有更高的鲁棒性和准确性。

PoseGravity: 通过点和线的姿态估计和轴向先验

BriefGPT - AI 论文速递 ·

本文介绍了基于深度学习和卡尔曼滤波的相机姿态估计方法，强调其在动态环境中的精度和鲁棒性，能够有效处理噪声和运动模糊，提升姿态估计的准确性。

DeepKalPose: 深度学习增强的卡尔曼滤波器用于时态一致单目车辆位姿估计

BriefGPT - AI 论文速递 ·

本文探讨了多种基于深度学习的相机姿态估计方法，重点在于全帧场景坐标回归、数据增强和卷积神经网络训练，以提高定位精度和鲁棒性。研究提出了新颖的损失函数和学习框架，利用少量标签数据和多视角约束，显著提升了重定位性能和三维场景表示的可伸缩性。

场景坐标重建：通过增量学习重定位器进行图像集合的姿态估计

BriefGPT - AI 论文速递 ·

本文探讨了使用可变形3D高斯方法进行动态场景重建和渲染，提出了一种高效的3D高斯喷涂表示法，能够实现高质量的实时渲染。研究表明，该方法在动态场景建模、相机姿态估计和新视角合成方面优于现有技术，具备快速渲染和高效训练的优势。

三维几何感知的可变形高斯光斑在动态视图合成中的应用

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的实时去模糊框架，利用小型多层感知机（MLP）重建清晰图像，改进动态模糊和虚焦模糊的处理。研究中引入了高效的可变形3D高斯散射方法，通过高斯网格喷洒（GaMeS）模型优化了渲染速度和质量，显著提升了视角合成和相机姿态估计的性能。

BAD-Gaussians：捆绑调整模糊高斯喷塗

BriefGPT - AI 论文速递 ·

本文提出了一种端到端可训练模型，用于感知3D场景、估计相机姿态和室内布局，并重建人体和物体网格。通过全面而复杂的损失，证明了该模型优于现有方法。这是第一个在网格级别输出对象和人体预测，并联合优化场景和人体姿态的模型。

LiDAR-HMR: LiDAR 中的 3D 人体网格恢复

BriefGPT - AI 论文速递 ·

该方法用于单个图像的三维立方体物体检测和多视图对象 SLAM，通过生成高质量的 cuboid 提议和新的对象测量的多视图束调整，联合优化相机、对象和点的姿态，提高了相机姿态估计和 3D 对象检测的准确性和鲁棒性。在 SUN RGBD 和 KITTI 上进行的实验证明了该方法的优越性。

UniQuadric：未知刚体物体 3D 跟踪和轻量建模的 SLAM 后端

BriefGPT - AI 论文速递 ·