小红花·文摘

本文探讨了大型语言模型（LLMs）在自我一致性方面的表现，提出了一种新的自我一致性方法（USC），通过多个候选答案选择最一致的结果。研究表明，USC在数学推理和代码生成等任务中显著提升了性能，并在开放式生成任务中有效利用多个样本。尽管一致性有所提高，但在特定主题上仍存在不一致性问题。