CharacterBox:评估大型语言模型在基于文本的虚拟世界中的角色扮演能力

📝

内容提要

本研究解决了评估大型语言模型(LLMs)在角色扮演能力方面的复杂性和不足之处,提出了一种名为CharacterBox的新方法。这一模拟沙箱不仅生成细粒度的人物行为轨迹,还通过角色代理和叙述代理的结合,提升评估的全面性。研究表明,CharacterBox能有效增强LLM的表现,并与先进的GPT API竞争。

🏷️

标签

➡️

继续阅读