小红花·文摘

本文提出了一种新的评估框架，基于LLMs，通过比较生成文本和参考文本来提供全面的评估。该模型模拟生成文本的客观和主观维度，并引入了上下文提示机制以生成动态角色扮演者配置文件。实验结果表明，该模型具有竞争力且与人类注释者一致。