互动至关重要:评估英语二语对话中的交互对话评估框架
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一个用于评估英语作为第二语言(ESL)说话者交互对话的评估框架。我们的框架收集对话级别的交互标签(例如主题管理;总共 4 个标签)和微级别的跨度特征(例如反馈;总共 17 个特征)。通过构建各种基于机器学习的模型,我们研究了微级别特征如何影响 ESL 对话的(更高级别的)交互质量。我们的结果表明,某些微级别特征与交互质量强相关,例如参考词(例如...
RoleInteract是一个用于评估角色扮演对话代理社交性的基准,包含500个角色、6,000个问题提示和30,800个多轮角色扮演话语。实验结果表明,个体水平上的表现并不代表其在群体水平上的熟练程度,强调了RoleInteract作为评估平台的重要性。