该研究提出了一种针对大型语言模型(LLMs)输出的事实准确性注释解决方案,旨在识别可验证性和事实不一致性。初步实验显示现有工具在识别错误声明方面存在困难。研究介绍了FACT-GPT系统,利用LLMs自动化事实核查,评估结果表明其准确性与人类判断相近。尽管LLMs在事实核查中展现潜力,但仍需谨慎使用,准确性不一致。
完成下面两步后,将自动完成登录并继续当前操作。