基于大型语言模型的房间 - 物体关系知识在增强多模态输入目标导航中的应用
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们在多通道Swin-Unet架构的基础上,使用数据驱动的、基于模块的方法进行多任务学习,实现了有效的目标导航。该方法在穿越多个房间时展示了高效性,超过了基准模型平均10.6%的效率指标(SPL)。
🎯
关键要点
- 基于多通道Swin-Unet架构进行多任务学习
- 采用数据驱动的、基于模块的方法
- 实现了有效的目标导航
- 超过基准模型平均10.6%的效率指标(SPL)
- 在现实世界演示中展示了高效性,尤其是在穿越多个房间时
➡️