本文探讨了如何利用大型语言模型(LLM)构建角色扮演对话数据集,并评估其角色扮演能力。研究开发了RoleBench和RoleInteract基准,涵盖多种角色和对话示例,揭示个体与群体互动中的表现差异。此外,提出了通过MORTISE改进角色对齐能力的策略,强调LLM在模拟人类行为和社会信念方面的潜力。
完成下面两步后,将自动完成登录并继续当前操作。