本文提出了一种新的评估框架,基于LLMs,通过比较生成文本和参考文本来提供全面的评估。该模型模拟生成文本的客观和主观维度,并引入了上下文提示机制以生成动态角色扮演者配置文件。实验结果表明,该模型具有竞争力且与人类注释者一致。
完成下面两步后,将自动完成登录并继续当前操作。