小红花·文摘 - 小红花技术领袖俱乐部

本论文研究了一种获取语言模型中编码信念的统计方法，并探讨了不同语言模型中的道德信念。调查结果显示，大多数模型在明确情景中选择与常识一致的行动，而在模棱两可的情况下表达了不确定性。

SaGE：大型语言模型中的道德一致性评估

BriefGPT - AI 论文速递 ·

这篇文章介绍了四词谬误，当一个三段论中出现四个或更多术语时，它就变得无效。四词谬误最常通过模棱两可的措辞出现，导致无效的推理。

形式逻辑错误：四个术语的谬误

极道 ·