如何利用离线数据集解决情境目标导向问题?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种通过任务重新标记的方法,提高任务性能。作者使用AirDialogue在航班预订任务上评估了该方法,结果表明其在任务成功率方面优于现有技术方法7%。
🎯
关键要点
- 提出了一种通过任务重新标记的方法,以提高任务性能。
- 将对话形式化为部分可观测的马尔可夫决策过程。
- 将语言模型解释为动态和策略的表示。
- 通过目标感知的方式微调语言模型,显著提高任务性能。
- 引入了一些训练策略,以更好地聚焦于手头的任务。
- 使用AirDialogue在航班预订任务上评估该方法。
- 结果表明,CALM在任务成功率方面优于现有技术方法7%。
➡️