本研究探讨了基于背景学习的评估器在自然语言生成方面的多维度评估,发现其与基于训练集的评估器在文本摘要等维度上具有同等效力和竞争力。研究还发现,在确定和选择上下文示例因素的影响下,基于背景学习的评估器在评估大型语言模型的零样本总结时也很有效。
完成下面两步后,将自动完成登录并继续当前操作。