超越翻译:基于大型语言模型的多语言事实核查数据生成

📝

内容提要

本研究解决了自动事实核查系统在多语言环境中的不足,尤其是在非英语语言的应用。提出的MultiSynFact是首个大规模多语言事实核查数据集,包含220万个声明-来源对,旨在支持西班牙语、德语和其他低资源语言。研究表明,该数据集生成方法有效地提升了模型在多语言事实核查中的表现,并开放源代码以推动该领域的进一步研究。

🏷️

标签

➡️

继续阅读