小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
DeepSeek公布全新论文,梁文锋署名

DeepSeek发布论文《条件记忆》,提出将“条件记忆”作为大语言模型的新稀疏维度,以解决知识检索的低效问题。研究表明,结合条件记忆与混合专家(MoE)可显著提升模型性能,特别是在知识推理和代码生成方面。预计新模型DeepSeek V4将应用此技术,进一步增强AI竞争力。

DeepSeek公布全新论文,梁文锋署名

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-13T06:03:09Z

刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章

机器之心
机器之心 · 2026-01-01T17:09:42Z

梁文锋因其DeepSeek模型入选2025年度《自然》十大科学人物,成为科技领域的颠覆者。该模型在AI行业产生重大影响,证明大模型不必依赖大量数据和资源。另一位入选者杜梦然因发现地球最深动物生态系统而获奖。

梁文锋,Nature全球年度十大科学人物!

量子位
量子位 · 2025-12-09T01:46:23Z

在浙江乌镇的世界互联网大会上,DeepSeek研究员陈德里代表创始人梁文锋发言。他对AI的未来持乐观态度,但担忧AI可能在十年内取代大部分工作,带来社会挑战。他提出“价值观对齐解耦化”的新思路,强调核心价值观统一而多元价值观可定制,以适应社会多样性。

梁文锋代表DeepSeek,他代表梁文锋

量子位
量子位 · 2025-11-15T07:00:25Z

刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋

机器之心
机器之心 · 2025-09-18T02:15:06Z
《时代》公布 AI 100 人:任正非梁文锋王兴兴入选,还有OpenAI最恨的两个人

《时代》周刊发布了2025年AI领域最具影响力的100人名单,包含华为任正非、DeepSeek梁文锋等中国科技领袖,以及记者Karen Hao等非技术背景人物。前OpenAI首席科学家Ilya Sutskever创办的公司估值已达320亿美元,而机器学习之父Hinton等人未上榜。

《时代》公布 AI 100 人:任正非梁文锋王兴兴入选,还有OpenAI最恨的两个人

爱范儿
爱范儿 · 2025-08-29T10:34:33Z

时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入选,华人影响力爆棚

机器之心
机器之心 · 2025-08-29T05:42:40Z

刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文

机器之心
机器之心 · 2025-07-31T02:19:27Z

DeepSeek的梁文锋团队在ACL 2025获得最佳论文奖,提出了原生稀疏注意力(NSA)机制,处理长文本的速度提升了11倍,性能超越传统模型。NSA通过动态分层策略优化计算,显著提高推理和训练效率,尤其在复杂推理任务中表现突出。

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

量子位
量子位 · 2025-07-31T00:04:22Z

Kimi发布了全新开源大模型K2,参数达到1T,激活参数32B,特别擅长代码和数学推理任务。K2采用MoE架构,支持128K上下文,旨在展示技术领先性。此次开源遵循修改版MIT协议,Kimi仍将继续自研大模型。

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA

量子位
量子位 · 2025-07-12T05:21:24Z

Robinhood CEO Vlad Tenev与Tudor Achim联合创立了人工智能初创公司Harmonic AI,专注于解决复杂数学问题,目标是构建超越人类的数学能力AI系统。Harmonic AI已完成B轮融资,估值接近9亿美元,致力于实现通用人工智能(AGI)。

美国版梁文锋来了

量子位
量子位 · 2025-07-11T06:53:14Z
DeepSeek 创始人梁文锋:颠覆AI世界的技术狂人,正威胁美国在 AI 竞赛中的主导地位

DeepSeek是一家中国初创公司,凭借在人工智能领域的突破迅速崛起,挑战西方主导的AI产品。创始人梁文峰低调专注,鼓励团队创新。尽管面临美国出口管制,中国AI技术依然快速发展,DeepSeek的成功促使人们重新评估中国的AI实力。

DeepSeek 创始人梁文锋:颠覆AI世界的技术狂人,正威胁美国在 AI 竞赛中的主导地位

宝玉的分享
宝玉的分享 · 2025-05-31T00:20:57Z

DeepSeek-V3再发论文,梁文锋署名,低成本训练大模型的秘密揭开了

机器之心
机器之心 · 2025-05-15T09:44:23Z

DeepSeek最新论文介绍了V3大模型的降本方法,解决了内存不足、计算效率低和通信速度慢的问题。通过内存优化、多头潜在注意力和混合专家模型等技术,DeepSeek-V3实现了高效训练和推理,降低了成本并提升了性能。未来AI硬件需向低精度计算和网络拓扑优化发展,以支持更大规模的模型训练。

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

量子位
量子位 · 2025-05-15T08:48:05Z
DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价

DeepSeek 发布了两个新工具 DualPipe 和 EPLB,旨在提升 AI 训练效率。DualPipe 通过双向流水线并行算法消除计算延迟,EPLB 优化专家并行负载均衡,帮助社区更好地理解和使用 DeepSeek 模型。

DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价

机器之心
机器之心 · 2025-02-27T03:45:16Z

DeepSeek今日发布三项开源技术,旨在优化并行策略,包括DualPipe算法实现前后计算重叠、EPLB负载均衡确保GPU资源均衡,以及Profiling Data提供性能分析。发布后10分钟内,三项技术在GitHub上获得近300个星标,广受好评。

DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

量子位
量子位 · 2025-02-27T03:09:02Z
刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

DeepSeek 发布了一种名为 NSA 的稀疏注意力机制,旨在提高长上下文的训练和推理效率。该机制通过硬件对齐和可训练设计,显著降低计算开销,同时保持性能。实验结果表明,NSA 在多个基准测试中表现优异,尤其在长上下文任务中展现出卓越的能力和加速效果。

刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

机器之心
机器之心 · 2025-02-18T09:30:36Z

梁文锋,1985年出生于广东湛江,数学天才,后成为AI先锋。他在浙江大学深造后创办雅克比投资和幻方量化,推动量化投资发展。2023年成立DeepSeek,进军通用人工智能,取得显著成就,受到家乡人民热烈欢迎。

DeepSeek创始人梁文锋个人履历

dotNET跨平台
dotNET跨平台 · 2025-02-02T00:03:19Z

DeepSeek-R1在硅谷大模型竞技榜上名列前三,创始人梁文锋强调创新与开源的重要性。DeepSeek专注于AGI研究,采用革命性架构以降低成本,吸引了广泛关注。尽管面临挑战,DeepSeek仍致力于推动技术进步和社会公益。

DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

量子位
量子位 · 2025-01-25T06:24:58Z
科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

本周科技动态包括天山胜利隧道贯通、AI模型DeepSeek V3崛起、AirTag充电盒发明及新加坡无护照出入境。DeepSeek V3因其低成本和高效能受到关注,创始人梁文锋强调中国应走向技术前沿。

科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

阮一峰的网络日志
阮一峰的网络日志 · 2025-01-03T01:10:55Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码