UAlign:利用不确定性估计对大型语言模型进行事实一致性对齐

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本研究提出UAlign框架,旨在提高大型语言模型在表达事实知识时的可靠性。通过不确定性估计来界定知识边界,增强模型对事实知识的对齐。实验结果表明,UAlign提升了模型对已知问题的回答信心,并能有效拒绝未知问题,展现出良好的性能和泛化能力。

原文中文,约300字,阅读约需1分钟。
阅读原文