探索大型语言模型展示理性概率信念的潜力
📝
内容提要
本研究针对大型语言模型(LLMs)在概率推理上的不足,探讨了当前模型在提供理性和一致的概率信念表示方面的缺陷。通过引入一个包含不确定真值的声明新数据集,并应用多种已建立的不确定性量化技术,研究表明当前LLMs在遵循概率推理的基本属性方面存在显著不足,这一发现对确保模型在自动决策系统中的信任度和效能具有潜在影响。
🏷️
标签
➡️