小红花·文摘

本文探讨了如何利用大型语言模型（LLM）构建角色扮演对话数据集，并评估其角色扮演能力。研究开发了RoleBench和RoleInteract基准，涵盖多种角色和对话示例，揭示个体与群体互动中的表现差异。此外，提出了通过MORTISE改进角色对齐能力的策略，强调LLM在模拟人类行为和社会信念方面的潜力。