大型语言模型在事实核查中的逻辑一致性

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本研究针对大型语言模型在处理复杂逻辑查询时表现出的逻辑不一致性问题,提出了一种新的评估方法及改进策略。通过引入基于知识图谱的三个逻辑事实核查数据集,证明了当前的语言模型在复杂查询中缺乏逻辑一致性,并通过监督微调提升了其在事实核查任务中的表现。

阅读原文