BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

SaGE:大型语言模型中的道德一致性评估

即使处于最先进状态的大型语言模型在生成对话系统方面显示出了令人印象深刻的能力,但我们展示了它们在道德一致性方面的不一致性,进而质疑它们的可靠性(以及总体的信任度)。

本论文研究了一种获取语言模型中编码信念的统计方法,并探讨了不同语言模型中的道德信念。调查结果显示,大多数模型在明确情景中选择与常识一致的行动,而在模棱两可的情况下表达了不确定性。

一致性 明确情景 模棱两可 编码信念 语言模型 道德信念

相关推荐 去reddit讨论

热榜 Top10

观测云
观测云
Dify.AI
Dify.AI
eolink
eolink
LigaAI
LigaAI

推荐或自荐