本研究提出了不忠实最小分组(BUMP)的基准测试,该数据集由889个人类编写的最小不同摘要对组成,摘要来自CNN / DailyMail数据集,揭示了度量标准的稳定性和不足之处。
完成下面两步后,将自动完成登录并继续当前操作。