小红花·文摘 - 小红花技术领袖俱乐部

研究表明，推理大模型在一年内可能面临性能扩展瓶颈，主要受数据限制、泛化能力和研发成本等挑战影响。尽管当前模型仍具潜力，但算力需求增长速度可能减缓，未来扩展将更加困难。

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 | FrontierMath团队最新研究

量子位 ·

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

机器之心 ·

DeepSeek是中国推出的开源推理大模型，具备强大的中文处理能力和金融优势。其V3和R1模型参数达到6000亿，适合深度思考场景。因低成本和开源特性，DeepSeek迅速流行，背后有强大资金支持和高水平团队。

DeepSeek简单分享

后端技术杂谈 ·

如何构建和优化推理型大型语言模型？DeepSeek R1的启示

如何构建和优化推理型大型语言模型？DeepSeek R1的启示

我爱自然语言处理 ·

新研究表明，DeepSeek等推理大模型在处理复杂问题时，因频繁切换思路导致思维不足，影响答案的准确性。研究团队提出了“思路切换惩罚机制”，有效提升了模型的准确率并减少了无效思考。

新研究揭示DeepSeek弱点：频繁切换思路欠思考，最短答案往往就对

量子位 ·