小红花·文摘

该研究提出了一种针对大型语言模型（LLMs）输出的事实准确性注释解决方案，旨在识别可验证性和事实不一致性。初步实验显示现有工具在识别错误声明方面存在困难。研究介绍了FACT-GPT系统，利用LLMs自动化事实核查，评估结果表明其准确性与人类判断相近。尽管LLMs在事实核查中展现潜力，但仍需谨慎使用，准确性不一致。