多任务多模态提示训练用于交互式具象任务完成

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

EMMA是一种编码-解码模型,能够处理交互和具身任务,并在Alexa Arena中的对话引导代理中取得了新的最佳结果。

🎯

关键要点

  • EMMA是一种统一的编码-解码模型,称为Embodied MultiModal Agent。
  • EMMA能够处理交互和具身任务。
  • 每个任务对目标完成做出贡献。
  • EMMA在Dialog-guided Task Completion (DTC)中取得了新的最佳结果,成功率为36.81%。
  • EMMA用于评估Alexa Arena中的对话引导代理。
➡️

继续阅读