本文介绍了多个论证挖掘相关的数据集和任务,如IAM、DebateSum和Mocheg,探讨了主张提取、立场分类和多模态事实核查等技术。研究表明,多任务学习和多语言模型能够提升论证挖掘的性能,并提出了新的基准测试和评估方法。
研究人员提出了一种名为FENICE的基于自然语言推理和主张提取的事实性评估摘要度量方法,通过对齐源文件中的信息和从摘要中提取的一组原子事实来评估摘要的一致性。该方法设立了一个新的标杆,并通过人工注释扩展到了更具挑战性的环境中。
完成下面两步后,将自动完成登录并继续当前操作。