AIxiv专栏促进学术交流,报道超过2000篇研究。中国人民大学等机构提出MS-Bot框架,解决机器人操控中的模态时变性问题,通过阶段理解动态融合多传感器数据,提升精细操控性能。
UniTR是一种高效的多模态骨干网络,用于处理多传感器数据并实现准确可靠的自动驾驶系统的感知。它通过模态不可知的转换编码器处理不同的传感器数据,并通过并行模态表示学习和自动跨模态交互来实现无需额外融合步骤。UniTR在nuScenes评测中取得了显著的提高,并具有较低的推理延迟。
本文介绍了一种利用多传感器数据的三维物体检测器,通过消除冲突融合方法(ECFusion)生成改进的多模态鸟瞰图特征。该方法在nuScenes三维物体检测数据集中取得了最先进的性能。
提出了一种基于深度自编码模型的多传感器数据的异常检测方法,用于在动态现实世界中可靠地执行机器人操作任务。通过训练深度自编码器构建多传感器数据的正常状态潜在表示,并通过测量潜在值之间的差异来识别异常。实验证明该方法可靠地检测到各种对象类型、机器人行为和环境中的对象滑动情况下的异常,尽管存在视觉和听觉噪声。
完成下面两步后,将自动完成登录并继续当前操作。