本研究提出RayFronts,旨在解决开放世界机器人中的开放集语义映射问题。该方法显著提高了语义映射的精确性与效率,并展示了改进的零-shot 3D语义分割性能,具有重要的应用潜力。
本研究解决了人形机器人在复杂地形中的平面语义映射问题,提出的GPU加速算法能够快速生成一致的语义地图,减少噪声并提高准确性。实验结果表明,该方法在实时应用中表现优异,对步态规划具有重要意义。
本文提出了TV-ProxyNet框架,解决了文本视频检索中模态差异的问题。通过将1对N关系转化为N个1对1关系,提高了查询精度和覆盖范围。实验结果显示,该方法在MSRVTT和ActivityNet Captions数据集上表现出色,改善了语义映射并减少了错误。
PanopticFusion是一种在线立体语义映射系统,能够预测背景区域和前景物体的标签和分割,重构大规模场景并提取标记的网格,实现像素级Panoptic标签的预测和CRF模型的规范化。该系统在语义和实例分割基准测试中表现优异,同时具有增强现实应用前景。
完成下面两步后,将自动完成登录并继续当前操作。