小红花·文摘 - 小红花技术领袖俱乐部

一项研究探讨了思维链（CoT）训练在大语言模型中的作用，发现其主要提升了提示词动作的质量，而非推理能力。模型在训练中更依赖提示词，导致注意力和梯度集中于提示部分。研究提出了一种干预方法，通过选择性掩盖动作令牌监督，增强模型的域外泛化能力，使其在新任务中表现更佳。

一分钟读论文：《Where Do CoT Training Gains Land in LLM based Agents?》

Micropaper ·

DeepSeek思维链土耳其语骂人事件全记录

DeepSeek思维链土耳其语骂人事件全记录

极道 ·

Claude Mythos潜在思维执行任务比OpenAI CoT思维链更强

Claude Mythos潜在思维执行任务比OpenAI CoT思维链更强

极道 ·

自适应思维：大型语言模型何时在潜在空间中思考

自适应思维：大型语言模型何时在潜在空间中思考

Apple Machine Learning Research ·

推理模型难以控制其思维链，这其实是件好事

推理模型难以控制其思维链，这其实是件好事

OpenAI ·

两天烧掉200美元！我AI大模型网关终于支持了Claude模型

两天烧掉200美元！我AI大模型网关终于支持了Claude模型

dotNET跨平台 ·

Redis 之父 Salvatore Sanfilippo 的年终 AI 反思

Redis 之父 Salvatore Sanfilippo 的年终 AI 反思

宝玉的分享 ·

全球首个“通用科研智能体”SciMaster发布

全球首个“通用科研智能体”SciMaster发布

全球TMT-美通国际 ·

斯坦福大学的Denny Zhou教授强调了大模型推理的重要性，指出中间推理步骤可以提高模型的准确性和自信心。他提出通过思维链和强化学习微调等方法，增强大语言模型的推理能力，以解决复杂问题。

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

量子位 ·

LLM Paper&Practice：从 CoT 到 ReAct

LLM Paper&Practice：从 CoT 到 ReAct

Ying’s Blog ·

新版DeepSeek-R1模型上线，实测用它做一个端午节赛龙舟小游戏

新版DeepSeek-R1模型上线，实测用它做一个端午节赛龙舟小游戏

TechWeb 全站精华 ·

多模态大模型在视觉推理能力评估中表现不佳，o3仅为25.8%，远低于人类的82.3%。新基准测试RBench-V揭示了模型在图像生成和理解方面的不足，强调了改进方向，如多模态思维链等新方法。

多模态大模型不会画辅助线？最新评估得分：o3仅25.8%，远低于人类82.3% | 清华腾讯斯坦福联合

量子位 ·

探索大型多模态模型在视频理解中的幻觉：基准、分析与缓解

探索大型多模态模型在视频理解中的幻觉：基准、分析与缓解

DEV Community ·

本研究提出了一种思维链跃迁桥接任务，以解决大型语言模型在数学任务中因缺失中间步骤而导致的思维跃迁问题。实验结果显示，经过微调的模型在数学推理基准上的表现提升最高可达5.87%。

Bridging the Gap: Mitigating Thought Jumps to Enhance Chain-of-Thought Fine-Tuning

BriefGPT - AI 论文速递 ·

翁荔在《Why We Think》中探讨了“测试时计算”和“思维链”如何提升人工智能模型性能。他指出，通过让模型在输出前进行更多思考，可以突破能力瓶颈，并借鉴人类思维过程。文章提出优化计算资源和引入潜变量建模等方法，以增强推理能力，同时讨论了并行采样与顺序修订的结合使用，以提高模型的准确性和自我修正能力。

翁荔最新万字长文：Why We Think

量子位 ·

本文提出了一种结合思维链与检索增强生成的方法，以解决大型语言模型在复杂任务中产生虚假信息的问题。研究表明，外部知识和自我验证策略的引入显著提升了模型的响应质量和推理深度。

Enhancing the Reliability of Large Language Models: Integrating Chain of Thought, Retrieval-Augmented Generation, Self-Consistency, and Self-Verification

BriefGPT - AI 论文速递 ·

我们为何思考

我们为何思考

Lil'Log ·

解锁复杂推理：OpenAI的O1和O3模型如何运作

解锁复杂推理：OpenAI的O1和O3模型如何运作

DEV Community ·

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

机器之心 ·

从零开始构建思维链 - 小白教程

从零开始构建思维链 - 小白教程

DEV Community ·