多任务多模态提示训练用于交互式具象任务完成
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
EMMA是一种编码-解码模型,能够处理交互和具身任务,并在Alexa Arena中的对话引导代理中取得了新的最佳结果。
🎯
关键要点
- EMMA是一种统一的编码-解码模型,称为Embodied MultiModal Agent。
- EMMA能够处理交互和具身任务。
- 每个任务对目标完成做出贡献。
- EMMA在Dialog-guided Task Completion (DTC)中取得了新的最佳结果,成功率为36.81%。
- EMMA用于评估Alexa Arena中的对话引导代理。
➡️