ComperDial: 基于常识和角色的对话数据集与基准
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究人员提出了基准系统ComperDial,用于开放领域对话系统的训练和评估。系统包括1,485个对话中的10,395个对话转折的人工评分响应。研究人员还开发了自动评估度量标准CPDScore,与人类判断相关。ComperDial和CPDScore已发布给社区,加速开放领域对话系统自动评估度量标准的开发。
🎯
关键要点
- 研究人员提出了基准系统ComperDial,用于开放领域对话系统的训练和评估。
- ComperDial包括1,485个对话中的10,395个对话转折的人工评分响应。
- 系统不仅包含单个对话转折的评分,还包括对整个对话的人工注释评分。
- 研究人员开发了自动评估度量标准CPDScore,与人类判断相关性更高。
- ComperDial和CPDScore已发布给社区,以加速开放领域对话系统自动评估度量标准的开发。
➡️