随着大型语言模型的出现,文本摘要取得了进展。然而,自动生成的摘要存在事实不一致的问题。为了解决这个问题,提出了基于自然语言推理和主张提取的事实性评估摘要度量方法。
研究人员提出了一种名为FENICE的基于自然语言推理和主张提取的事实性评估摘要度量方法,通过对齐源文件中的信息和从摘要中提取的一组原子事实来评估摘要的一致性。该方法设立了一个新的标杆,并通过人工注释扩展到了更具挑战性的环境中。
完成下面两步后,将自动完成登录并继续当前操作。