多场景推理:解锁人形机器人在多模态理解中的认知自主权

📝

内容提要

本研究针对人形机器人在多模态理解中的技术短板,提出了一种多场景推理架构,以提高其认知自主性。通过基于仿真的实验设计,该架构结合视觉、听觉和触觉的多模态合成,并构建了“玛哈”模拟器进行实验,结果表明该架构在多模态数据中的可行性,为人形机器人在动态环境中的跨模态交互策略探索提供了参考经验。

🏷️

标签

➡️

继续阅读