本文探讨了大型语言模型(LLMs)在自我一致性方面的表现,提出了一种新的自我一致性方法(USC),通过多个候选答案选择最一致的结果。研究表明,USC在数学推理和代码生成等任务中显著提升了性能,并在开放式生成任务中有效利用多个样本。尽管一致性有所提高,但在特定主题上仍存在不一致性问题。
完成下面两步后,将自动完成登录并继续当前操作。