评估开源大型语言模型在自动化事实核查中的应用

📝

内容提要

本研究针对在线错误信息的日益增多,评估了多种开源大型语言模型在事实核查中的有效性。通过实验发现,这些模型在识别声明与事实核查文章之间的关系及核实已核查故事方面表现良好,但在确认事实新闻时表现不佳,且引入外部知识并未显著提升其性能。这表明大型语言模型在自动化事实核查中具备潜力,但在可靠性上仍需进一步改进。

🏷️

标签

➡️

继续阅读