小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

DeepSeek V3.2 通过引入“系统 2”推理机制,重构了大型语言模型的解码策略,强调实时计算和思维链生成。其核心技术包括稀疏注意力机制和强化学习,提升了模型在复杂任务中的表现,标志着人工智能向理性智能体的演进。

神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

张善友
张善友 · 2025-12-14T01:42:00Z
Thinking, Fast and Slow

思维分为系统1和系统2:系统1快速直觉,易受偏见影响;系统2理性缓慢,消耗认知资源。有效决策需合理分配资源,减少无效消耗,通过习惯、环境和外部建议优化判断。理解这两种系统有助于提升决策质量。

Thinking, Fast and Slow

maxOS
maxOS · 2025-04-06T15:32:05Z
关于DeepSeek我是怎么研究的(2)

本文探讨了DeepSeek如何结合系统1(快速直观)与系统2(深思熟虑)思维来优化模型。系统1通过模式匹配快速响应,而系统2则通过逻辑推理处理复杂问题。两者结合提升了DeepSeek在推理生成和路径评估上的效率,增强了模型的决策能力。

关于DeepSeek我是怎么研究的(2)

Shadow Walker 松烟阁
Shadow Walker 松烟阁 · 2025-02-15T14:08:37Z
补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

Meta FAIR团队提出Dualformer,一种受人类认知理论启发的新型Transformer架构。它结合快速直觉的系统1和深思熟虑的系统2,通过随机化推理轨迹训练,在推理时选择快速或慢速模式,提高效率和能力。实验显示,Dualformer在迷宫和推箱子任务中优于基线模型,并在数学推理中表现更高效。

补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

机器之心
机器之心 · 2024-10-16T05:11:59Z
生成式AI 新一幕:推理模型登场 [译]

生成式AI革命后,AI研究从快速反应转向深度推理,推动智能应用发展。微软和谷歌主导市场,推理层成为新焦点。OpenAI的Strawberry模型具备通用推理能力。AI需从系统1进化到系统2。应用层公司通过定制认知架构创新,AI正转型为“服务即软件”。投资者关注应用层,推理研究将继续影响AI发展。

生成式AI 新一幕:推理模型登场 [译]

宝玉的分享
宝玉的分享 · 2024-10-10T14:42:55Z

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,超过了GPT4,同时降低了推理成本。他们使用了四种不同的系统2方法进行微调,发现这种模式使系统1模型的表现大幅提升,甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考,Llama2升至GPT4水平,不写过程也能做对题

量子位
量子位 · 2024-07-12T04:04:13Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码