机器之心 ·

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

💡 原文中文，约5700字，阅读约需14分钟。

📝

内容提要

研究者提出了一种新方法Coconut，通过在潜在空间中推理，提升了大语言模型（LLM）的推理能力。该方法直接利用最后的隐藏状态作为输入，避免了传统语言空间的限制。实验结果显示，Coconut在数学和逻辑推理任务中表现优于基于语言的推理方法，尤其在复杂规划任务中更具优势。

🎯

❓

Coconut通过在潜在空间中推理，直接利用最后的隐藏状态作为输入，避免了传统语言空间的限制，从而提升了推理能力。

实验结果显示，Coconut在数学推理（如GSM8k）和逻辑推理（如ProsQA）任务中表现优于基于语言的推理方法，尤其在复杂规划任务中更具优势。

Coconut方法通过简单修改CoT过程，将推理从语言空间中解放出来，直接使用最后的隐藏状态进行推理，而不是依赖语言模型头和嵌入层。

Coconut采用多阶段训练策略，有效利用语言推理链指导训练过程，逐步替换推理步骤以增强潜在推理的训练效果。

Coconut能够同时编码多个潜在下一步，提升推理效率，并在潜在空间中更好地评估每一步的合理性，从而在复杂推理任务中表现更佳。

Coconut的连续思维机制允许模型在推理过程中保持多个潜在选项，通过逐步排除错误路径来提高推理的准确性和效率。

🏷️

模块化：为什么LLM推理需要一种新型路由器 - 第三部分
Modular Cloud的路由层通过准备、过滤、评分、选择和执行五个阶段实现高效请求处理。该框架支持可组合插件，快速实现新路由优化，适应不同工作负载需求...
从超级个体到超级团队，腾讯云发布WorkBuddy企业版
腾讯云在AI产业应用大会上发布了WorkBuddy企业版及办公智能体套件，旨在帮助企业实现AI转型。该套件提供数字员工、人机协作和团队管理功能，提升工作效...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
一分钟读论文：《思想的经济：Agent经济交互中的多智能体智能涌现》
多位来自MIT、斯坦福大学、康奈尔大学等机构的学者合作发表的论文《Economy of Minds: Emerging Multi-Agent Intel...
团队在处理重复支付时面临的后台挑战
现代支付系统表面简单，但重复交易的后台复杂性显著。文章探讨了构建重复支付系统时的七个挑战，包括管理支付计划、避免重复收费、优雅处理失败支付、保持系统状态一...
60分钟内消失
It should have been the final straw. The new power couple of editorial failur...