擎朗智能于3月31日发布了人形服务机器人XMAN-R1,旨在构建多形态协作生态。该机器人设计注重岗位化、亲和力和安全性,能够完成点单、配餐、送餐和收餐等任务。配备多模态传感器和大语言模型,提升人机互动,适用于餐厅和酒店等场景。
本研究提出了一种利用多模态传感器(如眼动追踪和生理手环)来估算人际间舒适的个人空间模型。该模型能够有效预测个人空间偏好,最高预测准确率为F1得分0.87,为智能社交空间的个性化管理提供了新思路。
本研究提出了doScenes数据集,旨在解决自主车辆如何有效整合人类指令的问题。该数据集结合多模态传感器数据与自然语言指令,为人机协作导航开发新策略奠定基础。
本研究提出了SocialMind,一个基于大语言模型的主动增强现实社交辅助系统。该系统结合人类感知能力与多模态传感器,在实时社交互动中提供帮助,显著提高用户参与度,评估结果显示参与度比基线高出38.3%。
本文探讨了利用LiDAR和多模态传感器的数据融合技术,以提升自动驾驶车辆的3D物体检测精度和协同感知能力。提出了多种融合方案和数据集,评估了不同方法在复杂驾驶场景中的表现,强调了集体感知在信息共享中的重要性,并介绍了优化性能的新融合框架。
本文探讨大型语言模型(LLM)在自动驾驶系统中的应用,提出LMDrive框架,结合多模态传感器数据和自然语言指令,提升自动驾驶决策的安全性和效果。实验表明,LLM在复杂场景中的表现优越,推动了人性化自动驾驶的发展。
该研究使用深度学习和多模态传感器融合技术提高自动驾驶的性能和泛化能力,并在仿真城市驾驶条件下测试了该模型。结果表明,该模型在定位和避障等任务方面表现更好,并验证了多模态传感器融合和场景理解子任务的协同作用。
该研究利用深度学习和多模态传感器融合技术提高自动驾驶的性能和泛化能力,并测试了在仿真城市驾驶条件下的性能和通用能力。结果显示,该模型在定位和避障等任务中的成功率优于先前的模型,验证了多模态传感器融合和场景理解子任务的协同作用提高了模型的性能和可行性。
本文介绍了一种增强现有3D感知和6D物体姿态数据集的新方法,通过机器人前向运动学、外部红外跟踪器和改进的校准和注解过程,提出了一个多模态传感器装置,用于创建高精度的3D数据。该方法有效地克服了现有数据集的限制,并为3D视觉研究提供了宝贵的资源。
完成下面两步后,将自动完成登录并继续当前操作。