小红花·文摘 - 小红花技术领袖俱乐部

神经推理的蜕变：从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

神经推理的蜕变：从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

张善友 ·

Thinking, Fast and Slow

Thinking, Fast and Slow

maxOS ·

关于DeepSeek我是怎么研究的(2)

关于DeepSeek我是怎么研究的(2)

Shadow Walker 松烟阁 ·

补齐Transformer规划短板又不放弃快速思考，田渊栋团队的Dualformer融合System 1和2双重优势

补齐Transformer规划短板又不放弃快速思考，田渊栋团队的Dualformer融合System 1和2双重优势

机器之心 ·

生成式AI 新一幕：推理模型登场 [译]

生成式AI 新一幕：推理模型登场 [译]

宝玉的分享 ·

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”，使Llama2的表现提升了257%，超过了GPT4，同时降低了推理成本。他们使用了四种不同的系统2方法进行微调，发现这种模式使系统1模型的表现大幅提升，甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

量子位 ·