小红花·文摘

RoleInteract是一个用于评估角色扮演对话代理社交性的基准，包含500个角色、6,000个问题提示和30,800个多轮角色扮演话语。实验结果表明，个体水平上的表现并不代表其在群体水平上的熟练程度，强调了RoleInteract作为评估角色扮演对话代理社交互动的测试平台的重要性。

BriefGPT - AI 论文速递 ·

RoleInteract是一个用于评估角色扮演对话代理社交性的基准。通过评估500个角色和超过6,000个问题提示以及30,800个多轮角色扮演话语，发现个体水平上表现出色的代理不一定在群体水平上也表现出色。实验结果证实了RoleInteract作为评估角色扮演对话代理社交互动的测试平台的重要性。

BriefGPT - AI 论文速递 ·

本文介绍了RoleInteract基准，用于评估角色扮演对话代理在个体和社交互动组别两个级别上的社交性。评估发现，个体水平上表现出色的代理在群体水平上可能会受到其他代理的影响而发生漂移。RoleInteract作为评估角色扮演对话代理社交互动的测试平台具有重要性。

BriefGPT - AI 论文速递 ·