小红花·文摘

本文探讨可解释自动事实核查中的行动性评估问题，指出现有研究缺乏有效评估方法。提出的FinGrAct框架通过明确标准和评估数据集，提高评估准确性，减少偏见，具有重要的实际应用价值。

FinGrAct: A Framework for Detailed Evaluation of Actionability in Explainable Automated Fact-Checking

BriefGPT - AI 论文速递 ·

本研究提出了一种基于检索增强生成的评估方法，对自动事实核查进行基准测试。结果表明，尽管大型语言模型在真实性核查方面表现良好，但在处理不同知识库时仍面临挑战，显示出未来改进的潜力。

Facing the Facts! Evaluating RAG-based Fact-Checking Pipelines in Real-World Environments

BriefGPT - AI 论文速递 ·

本研究提供了多个数据集和模型，以提高自动事实核查的效率和准确性。使用Averitec数据集和新模型，研究显示在社交媒体上预测声明真实性和提供证据的性能有所提升。提出的系统HerO在排行榜中名列第二，展示了开放大语言模型在事实核查中的潜力。

文本主张自动验证（AVeriTeC）共享任务

BriefGPT - AI 论文速递 ·

本研究提出了多个自动事实核查模型和数据集，旨在提高事实验证的准确性和效率。新算法和数据集的引入使得这些模型在声明验证方面表现优越，尤其在鲁棒性和解释性上。FOLK等新方法通过一阶逻辑推理显著提升了验证效果。

对比学习以提高现实世界事实检查的检索能力

BriefGPT - AI 论文速递 ·

本文综述了自然语言处理领域的自动事实核查研究，强调证据的重要性，并提出未来研究方向。介绍了多种模型和方法，包括基于神经语义匹配和图卷积网络，以及新数据集FactKG，旨在提高事实核查的准确性和可靠性。研究表明，丰富的结构信息和原始文档证据显著提升系统性能，有助于打击信息误传。

事实还是虚构？通过简化子图检索提高事实验证

BriefGPT - AI 论文速递 ·

自动事实核查利用大型语言模型（LLMs）如GPT-4，提高了虚假信息验证的能力。研究表明，LLMs在事实核查任务中表现出色，但准确性受查询语言和主张真实性的影响。FACT-GPT系统通过索引匹配实现自动化事实核查，准确性接近人类判断。尽管LLMs在大多数场景中表现良好，但在中文验证中仍面临挑战，需要进一步研究以增强其可靠性。

CheckThat! 2024 中的事实查找者：通过数据修剪改善 LLMs 的适用于检查的陈述检测

BriefGPT - AI 论文速递 ·

自动事实核查对于验证虚假信息变得至关重要。大型语言模型（LLMs）如GPT-4可以验证信息并撰写学术论文、诉讼文件和新闻文章。LLMs在配备上下文信息的情况下表现出更强大的能力。然而，LLMs的准确性不一致，需要进一步研究以了解代理人何时成功以及何时失败。

通过多智能体辩论实现忠实可解释的事实核查

BriefGPT - AI 论文速递 ·

自动事实核查对于验证虚假信息变得至关重要。研究显示，配备上下文信息的GPT-4比GPT-3更强大。准确性取决于查询语言和主张的真实性。调研呼吁进一步研究以了解代理人何时成功以及何时失败。

地球是平的吗？揭示大型语言模型中的事实错误

BriefGPT - AI 论文速递 ·

自动事实核查对于验证虚假信息变得至关重要。大型语言模型（LLMs）如GPT-4可以验证信息并撰写学术论文、诉讼文件和新闻文章。虽然LLMs在事实核查方面显示出前景，但准确性不一致，需要谨慎使用。调研呼吁进一步研究。

使用 ChatGPT 对虚假新闻数据集进行增强事实核查的再访

BriefGPT - AI 论文速递 ·

文章讨论了使用LLMs进行自动事实核查的重要性和挑战，结果显示在配备上下文信息的情况下，LLMs表现出更强大的能力。作者呼吁进一步研究，以更深入地了解代理人何时成功以及何时失败。

人物角色作为建模语言模型真实性的方法

BriefGPT - AI 论文速递 ·

本文探讨了自动事实核查的重要性，尤其是在人类无法应对虚假信息的情况下。大型语言模型（LLMs）可以验证信息并撰写学术论文、诉讼文件和新闻文章，但准确性取决于查询语言和主张的真实性。作者通过让LLM代理人表达查询、检索上下文数据和做出决策来评估LLMs在事实核查中的使用，并发现在配备上下文信息的情况下，LLMs表现出更强大的能力。作者呼吁进一步研究以更深入地了解代理人何时成功以及何时失败。

大语言模型事实核查的风险与前景

BriefGPT - AI 论文速递 ·