重新思考事实验证的损失函数
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一个新的公开可用的数据集 FEVER:事实提取和验证,包含185,445个主张。作者使用流水线方法对该数据集进行测试,最佳准确性达到了31.87%。FEVER是一个具有挑战性的测试平台,可以促进对文本来源的声明验证的进展。
🎯
关键要点
- 介绍了一个新的公开可用的数据集 FEVER:事实提取和验证。
- 该数据集包含 185,445 个主张。
- 数据集通过更改从维基百科中提取的句子进行验证。
- 标注具有高度不确定性,增加了数据集的挑战性。
- 作者开发了一种流水线方法进行测试,最佳准确性为 31.87%。
- FEVER 是一个具有挑战性的测试平台,促进文本来源的声明验证进展。
➡️