角色互动评估:评估角色扮演代理人的社交互动
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了RoleInteract基准,用于评估角色扮演对话代理在个体和社交互动组别两个级别上的社交性。评估发现,个体水平上表现出色的代理在群体水平上可能会受到其他代理的影响而发生漂移。RoleInteract作为评估角色扮演对话代理社交互动的测试平台具有重要性。
🎯
关键要点
- RoleInteract是第一个系统评估角色扮演对话代理社交性的基准。
- 该基准涵盖了500个角色、超过6000个问题提示和30800个多轮角色扮演话语。
- 评估发现,个体水平上表现出色的代理在群体水平上可能会受到其他代理的影响而发生漂移。
- RoleInteract的重要性在于它作为评估角色扮演对话代理社交互动的测试平台。
- 该基准可公开访问。
🏷️
标签
➡️