OpinSummEval是一个包含人工评价和14个观点总结模型输出的数据集。研究发现,神经网络的指标通常优于非神经网络的指标,但即使是强大的模型如BART和GPT-3/3.5也不能在所有维度上一致地与人工评分相关,需要改进观点总结自动评估方法。
完成下面两步后,将自动完成登录并继续当前操作。