本文介绍了一种名为“Rooms from Motion”(RfM)的新方法,用于无姿态图像的室内3D物体检测。RfM通过基于图像的3D框替代传统的2D关键点匹配,能够估计相机姿态和物体轨迹,生成高质量的语义3D物体地图。与现有方法相比,RfM在定位性能和地图质量上表现优异,适用于增强现实和机器人等领域。
本研究提出了多种基于LiDAR的技术,包括高效的姿态回归模型HypLiLoc、语义地图构建方法、平面提取方法和移动物体分割框架MotionBEV。这些方法在激光雷达数据集上表现出色,提升了点云处理的准确性和效率,适用于自动驾驶和复杂环境中的点云重建。
本文介绍了一种结合语义实例识别和多帧数据关联技术的机器人实时构建语义地图的方法。研究展示了零样本导航模型VLFM的有效性,能够在新环境中识别目标对象并成功导航。此外,提出了OpenFMNav模型,利用大型语言模型进行开放集对象导航,验证了其在复杂环境中的有效性。
本文介绍了一种名为GSNeRF的新方法,将图像语义纳入合成过程中,生成新视图图像和语义地图。GSNeRF由语义地理推理和深度引导的视觉渲染两个阶段组成,能够提取语义和几何特征,并利用图像几何信息进行渲染。实验证实了GSNeRF在新视图图像和语义分割合成方面的优势,并验证了采样策略的有效性。
本文介绍了GSNeRF,一种用于合成新视图图像和语义地图的新方法。GSNeRF包括语义地理推理和深度引导的视觉渲染两个阶段。实验证实了GSNeRF在合成新视图图像和语义分割方面的优越性。
我们提出了一个多领域艺术品合成框架,利用条件生成对抗网络从语义地图生成高质量艺术作品。该框架结合数据集和方法,能够生成用户可控的高质量艺术作品。
研究提出了一种名为 VioLA 的方法,通过建立语义地图和利用图像序列与 LiDAR 扫描进行地点对齐的问题。使用预训练的文本到图像修复模型和深度补全模型填补缺失的场景内容以支持姿态注册。在两个真实的 RGB-D 基准数据集以及一个大型办公场景的自录数据集上对 VioLA 进行评估,提高了姿态注册性能 20%。
完成下面两步后,将自动完成登录并继续当前操作。