本文介绍了一种名为“Rooms from Motion”(RfM)的新方法,用于无姿态图像的室内3D物体检测。RfM通过基于图像的3D框替代传统的2D关键点匹配,能够估计相机姿态和物体轨迹,生成高质量的语义3D物体地图。与现有方法相比,RfM在定位性能和地图质量上表现优异,适用于增强现实和机器人等领域。
本研究提出了多种基于LiDAR的技术,包括高效的姿态回归模型HypLiLoc、语义地图构建方法、平面提取方法和移动物体分割框架MotionBEV。这些方法在激光雷达数据集上表现出色,提升了点云处理的准确性和效率,适用于自动驾驶和复杂环境中的点云重建。
本文介绍了一种结合语义实例识别和多帧数据关联技术的机器人实时构建语义地图的方法。研究展示了零样本导航模型VLFM的有效性,能够在新环境中识别目标对象并成功导航。此外,提出了OpenFMNav模型,利用大型语言模型进行开放集对象导航,验证了其在复杂环境中的有效性。
本文提出了一种单源域泛化框架用于车道检测,通过核心子集数据增强泛化性能。同时介绍了HDMapNet语义地图学习方法,利用多传感器数据提升地图构建效果。研究表明,标准清晰度地图能有效支持实时车道拓扑理解,显著提高车道检测能力。
本文提出了一种基于LiDAR的语义地图构建方法,结合BEV金字塔特征解码器和在线相机到LiDAR的知识蒸馏方案,显著提升了自动驾驶中的检测准确性。通过跨模态知识蒸馏,缩小了相机与LiDAR检测器之间的性能差距,实验结果在nuScenes数据集上表现优越。
本文提出了一种基于车载摄像头的道路布局推断模型,结合深度学习和多模态数据,以提升自动驾驶的安全性和准确性。研究表明,合成数据在训练中的有效性,并提出了一种高效的3D语义映射流程,能够生成大规模的语义地图,改善道路感知系统的性能。
本文提出了一种新颖的室内导航方法,通过对比自我中心视图和语义地图,提升了代理的导航能力。实验结果表明,该方法在目标导航中优于现有视觉预训练技术,并显著改善了视觉和语言导航的表现。此外,研究探讨了利用深度学习和自然语言处理优化机器人导航,并提出了新的语义地图生成框架,以提升导航性能。
本文介绍了 GS-SLAM 算法,首次在 SLAM 系统中应用 3D 高斯表示,提升了效率与准确性。该方法通过自适应扩张策略重构场景几何并优化相机姿态,在 Replica 和 TUM-RGBD 数据集上表现出竞争力。SemGauss-SLAM 系统结合语义特征,实现实时精确的 3D 语义地图构建和鲁棒的相机跟踪,展现出优越性能。
本文提出了一种一般化语义神经辐射场(GSNeRF)的方法,结合语义信息生成新视图图像和语义地图。GSNeRF通过语义地理推理和深度引导视觉渲染两个阶段,提高了图像合成性能,实验结果显示其在新视图图像和语义分割方面优于以往技术。
我们提出了一个多领域艺术品合成框架,利用条件生成对抗网络从语义地图生成高质量艺术作品。该框架结合数据集和方法,能够生成用户可控的高质量艺术作品。
研究提出了一种名为 VioLA 的方法,通过建立语义地图和利用图像序列与 LiDAR 扫描进行地点对齐的问题。使用预训练的文本到图像修复模型和深度补全模型填补缺失的场景内容以支持姿态注册。在两个真实的 RGB-D 基准数据集以及一个大型办公场景的自录数据集上对 VioLA 进行评估,提高了姿态注册性能 20%。
完成下面两步后,将自动完成登录并继续当前操作。