本研究提出了PersonaConvBench基准,旨在评估个性化推理与生成,解决个性化与对话结构的孤立问题。引入个性化历史显著提升了大型语言模型的性能,情感分类提升了198%。
完成下面两步后,将自动完成登录并继续当前操作。