小红花·文摘

本研究提出了多个框架（如SELF-DISCOVER、Dualformer和AtomThink），旨在提升大型语言模型在复杂推理任务中的能力。研究表明，通过自我发现和动态决策等方法，模型在多个推理基准上显著提高了性能，并在效率和计算成本上表现优越。这些创新为AI推理能力的提升提供了新的见解和应用潜力。

模仿、探索与自我提升：慢思考推理系统的再现报告

BriefGPT - AI 论文速递 ·

最近新模型智障检测出现问题，无法正确数出单词“Strawberry”中的“r”。全球网友尝试各种提示词技巧教会大模型数“r”，成功方法包括使用漫画《死亡笔记中》角色“L”的方法和DeepMind的Self-Discover论文中的方法。有人还尝试使用AI想象一个从0开始的内存计数器来计算文档中“strawberry”出现的次数。ChatGPT和谷歌Gemini也有一定概率能答对。国内选手在测试中表现稳定。大模型公司希望在下个版本中解决这个问题。

大模型智障检测+1：Strawberry有几个r纷纷数不清

量子位 ·

SELF-DISCOVER是一个通用的框架，用于自我发现任务内在的推理结构，提高推理问题的解决能力。相较于CoT，性能提升高达32%。在推理计算量较少的情况下，超过了CoT-Self-Consistency等推理密集型方法20%以上。自我发现的推理结构在不同模型族之间是普适的。

自我探索：大型语言模型的自我组织推理结构

BriefGPT - AI 论文速递 ·