小红花·文摘 - 小红花技术领袖俱乐部

通过可控轨迹学习结构化推理

通过可控轨迹学习结构化推理

Apple Machine Learning Research ·

.NET+AI | MEAI | 基于 IChatClient 获取思考过程（15）

.NET+AI | MEAI | 基于 IChatClient 获取思考过程（15）

dotNET跨平台 ·

本研究提出了Thinkless框架，旨在提高大型语言模型在复杂逻辑推理中的效率。该框架允许模型根据任务复杂性自适应选择推理模式，实验证明可减少50%至90%的长链推理使用。

Thinkless: Learning When to Reason in Large Language Models

BriefGPT - AI 论文速递 ·

DeepSeek推出的Prover-V2模型专注于数学定理证明，刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题，展现出独特的推理模式。Prover-V2结合强化学习与子目标分解，提升了形式化与非形式化证明的能力，标志着数学领域的重要进展。

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

量子位 ·

ReAct与计划执行：LLM代理模式的实用比较

ReAct与计划执行：LLM代理模式的实用比较

DEV Community ·