本研究提出了多个框架(如SELF-DISCOVER、Dualformer和AtomThink),旨在提升大型语言模型在复杂推理任务中的能力。研究表明,通过自我发现和动态决策等方法,模型在多个推理基准上显著提高了性能,并在效率和计算成本上表现优越。这些创新为AI推理能力的提升提供了新的见解和应用潜力。
最近新模型智障检测出现问题,无法正确数出单词“Strawberry”中的“r”。全球网友尝试各种提示词技巧教会大模型数“r”,成功方法包括使用漫画《死亡笔记中》角色“L”的方法和DeepMind的Self-Discover论文中的方法。有人还尝试使用AI想象一个从0开始的内存计数器来计算文档中“strawberry”出现的次数。ChatGPT和谷歌Gemini也有一定概率能答对。国内选手在测试中表现稳定。大模型公司希望在下个版本中解决这个问题。
SELF-DISCOVER是一个通用的框架,用于自我发现任务内在的推理结构,提高推理问题的解决能力。相较于CoT,性能提升高达32%。在推理计算量较少的情况下,超过了CoT-Self-Consistency等推理密集型方法20%以上。自我发现的推理结构在不同模型族之间是普适的。
完成下面两步后,将自动完成登录并继续当前操作。