小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

DeepSeek R1 是中国 AI 公司推出的模型,采用纯强化学习实现自主推理,突破传统监督学习模式。R1-Zero 模型无需人类标注,展现出链式推理能力。GRPO 算法提升训练效率,简单的奖励系统驱动复杂推理策略。R1 的成功降低了推理模型的门槛,启发了新的研究方向,展示了纯强化学习的潜力,标志着 AI 训练的重要转变。

DeepSeek-R1:用纯强化学习解锁大语言模型的推理能力

Micropaper
Micropaper · 2026-03-01T22:30:00Z
DeepSeek-R1:用纯强化学习解锁大语言模型的推理能力

DeepSeek-R1通过纯强化学习显著提升大语言模型的推理能力,无需人类标注。该方法使模型能够自主探索思维链,展现自我反思和动态策略调整的高级推理模式。实验结果表明,其在数学、代码和逻辑推理任务中表现优异,降低了开发成本并加快了迭代速度。

DeepSeek-R1:用纯强化学习解锁大语言模型的推理能力

Micropaper
Micropaper · 2026-02-28T20:17:00Z
DeepSeek Engram:颠覆GPU内存瓶颈!把知识存储从计算中分离,O(1)查找效率!

DeepSeek与北大团队推出的Engram系统,通过分离静态知识存储与动态推理,实现O(1)查找效率,降低了对昂贵GPU内存的需求。这一创新在普通DRAM中存储大量知识,提升了大模型的性能和成本效益,尤其对中国AI公司具有重要意义。

DeepSeek Engram:颠覆GPU内存瓶颈!把知识存储从计算中分离,O(1)查找效率!

Micropaper
Micropaper · 2026-02-28T17:15:00Z
PaddleFormers Driver: Minimum Domestic Computing Power Achieves Full Parameter Fine-tuning Practice for DeepSeek-V3 (671B)

保持健康的三条建议:1. 均衡饮食,多吃水果和蔬菜;2. 定期锻炼,保持活跃;3. 充足睡眠,规律作息。

PaddleFormers Driver: Minimum Domestic Computing Power Achieves Full Parameter Fine-tuning Practice for DeepSeek-V3 (671B)

百度大脑
百度大脑 · 2026-02-27T14:30:51Z
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能

DeepSeek推出的DualPath推理框架通过引入存储至解码引擎的路径,解决了I/O瓶颈,离线推理吞吐量提升1.87倍,在线服务提升1.96倍,有效利用闲置带宽,显著降低延迟。

DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能

量子位
量子位 · 2026-02-27T08:11:51Z
1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)通过蒸馏其模型并提供日志和交互数据作为证据。蒸馏是否构成抄袭存在争议,Anthropic认为这些公司通过混淆账号和IP地址进行不当行为。尽管Deepseek V4尚未发布,相关指控已引发关注,未来可能面临法律后果。

1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

硕鼠的博客站
硕鼠的博客站 · 2026-02-26T00:51:04Z

字节Seed通过化学思想重新定义AI长链思维,提出深度推理、自我反思和自我探索三种思维行为,形成稳定的推理结构。这些行为在推理过程中相互作用,提升模型的逻辑聚焦和思维覆盖,进而提高推理效率。

字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构

量子位
量子位 · 2026-02-24T07:23:05Z

DeepSeek在GitHub上进行大规模更新,引发美国AI圈关注,市场预警“DeepSeek第二时刻”即将来临。更新内容包括API集成项目和企业解决方案,显示出对DeepSeek的集成需求。大家期待DeepSeek V4的发布。

DeepSeek连更GitHub,华尔街回想起被支配的恐惧:“DeepSeek第二时刻”要来了

量子位
量子位 · 2026-02-24T04:00:41Z
Anthropic指控DeepSeek及其他中国公司利用Claude训练其人工智能

Anthropic指控DeepSeek等三家中国AI公司滥用其Claude AI模型,创建24,000个虚假账户并进行1600万次交流。尽管“蒸馏”是合法的训练方法,Anthropic警告其可能被用于非法目的,助长专制政权的网络攻击和监控。

Anthropic指控DeepSeek及其他中国公司利用Claude训练其人工智能

The Verge
The Verge · 2026-02-23T20:22:55Z
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

本文系统梳理了多种高质量OCR开源模型,介绍了OCR技术的发展及其在金融、医疗和电商等领域的应用。新一代模型如GLM-OCR和PaddleOCR-VL-1.5具备高精度、多语言识别和复杂文档解析能力,推动OCR从文字提取工具向结构化信息理解引擎转变。

OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

HyperAI超神经
HyperAI超神经 · 2026-02-22T03:10:21Z

从AlphaGo到DeepSeek R1,推理的未来将走向何方?

机器之心
机器之心 · 2026-02-20T14:49:15Z
OpenAI再次指控DeepSeek违规“蒸馏”其模型

OpenAI指控中国初创公司DeepSeek违规使用“模型蒸馏”技术,复制其产品功能,并已向美国国会提交证据。尽管面临指控,DeepSeek凭借低成本研发出性能相当的竞争产品,市场表现依然强劲,成为OpenAI的主要竞争对手。

OpenAI再次指控DeepSeek违规“蒸馏”其模型

Jing Blog
Jing Blog · 2026-02-17T07:45:21Z

复杂的推理过程动不动几十个步骤,要让人类专家给每一个步骤都打分,这数据标注的成本高到离谱,导致训练“奖励模型”的成本太高。但如果你让他去搞文学创作、写个段子,他那套“死磕逻辑”的方法可能就会显得有点“直男”,甚至会用力过猛,把简单问题复杂化。甚至,它学会了自我反思,你会看到它在输出里写:“哎呀,这步好像算错了,我重新推导一下...”今天,咱们不聊晦涩的参数,就带你把 DeepSeek...

DeepSeek 发布一年了,你真的会用吗?

dotNET跨平台
dotNET跨平台 · 2026-02-13T00:02:09Z
GB300上的DeepSeek-V3.2:性能突破

DeepSeek-V3.2在GB300上成功运行,使用FP4量化在预填充场景中实现7360 TGS的吞吐量。与DeepSeek-R1相比,V3.2在推理性能上仍有提升空间。B300系列在预填充和混合场景中表现出显著性能提升,尽管V3.2引入了新索引器,但预填充阶段的吞吐量仍低于R1,未来有优化潜力。

GB300上的DeepSeek-V3.2:性能突破

vLLM Blog
vLLM Blog · 2026-02-13T00:00:00Z
一夜变脸!DeepSeek从“理工男”秒变“知心姐姐”

DeepSeek App于2月12日更新至1.7.4版本,提升了上下文处理和文件分析能力,但对话风格变化引发用户不满,认为变得“油腔滑调”。新版本可能为即将发布的DeepSeek V4模型铺路,预计2026年推出。

一夜变脸!DeepSeek从“理工男”秒变“知心姐姐”

TechWeb 全站精华
TechWeb 全站精华 · 2026-02-12T05:51:59Z
早报|DeepSeek悄悄更新,春节模型大战开启/三星S26月底见,或首发2nm处理器/车用固态电池国标要来了

春节期间,车用固态电池国标将于7月发布;苹果Siri功能推迟至9月;xAI两名创始人离职;腾讯与特斯拉合作推出微信互联服务;字节跳动研发AI芯片;马斯克计划在月球建厂。

早报|DeepSeek悄悄更新,春节模型大战开启/三星S26月底见,或首发2nm处理器/车用固态电池国标要来了

爱范儿
爱范儿 · 2026-02-12T01:30:50Z
DeepSeek开创的风俗,春节中国模型大爆发?

春节临近,各大模型厂商纷纷推出新产品。Kimi 2.5因其多模态能力和智能体架构受到关注,字节跳动的SEEDANCE和SEEDREAM也在更新中。阿里千问3.5即将发布,具备混合注意力机制和视觉理解能力。市场竞争激烈,预计春节期间将有更多新模型亮相。

DeepSeek开创的风俗,春节中国模型大爆发?

硕鼠的博客站
硕鼠的博客站 · 2026-02-11T00:36:57Z

智谱AI的GLM-5架构曝光,采用DeepSeek稀疏注意力机制和多Token预测,参数量达到745B,是GLM-4.7的两倍。新模型Pony Alpha被认为是GLM-5的测试版。智谱股价在两天内上涨60%,预计GLM-5将在2026年春节前发布。

GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力

量子位
量子位 · 2026-02-10T07:59:24Z

华大生命科学研究院与浙江之江实验室组成的 Genos 团队在 DeepSeek 新模式的启发下,推出了一款基因组专用「外挂大脑」插件——Gengram(Genomic Engram)。仅约 2,000 万参数,即刷新了多项基因组任务的 SOTA 记录,为破解基因组建模瓶颈提供了革命性方案。

受DeepSeek Engram启发,基因组基础模型「外挂大脑」Gengram最高实现22.6%性能提升

HyperAI超神经
HyperAI超神经 · 2026-02-06T06:45:17Z
七牛云赠送 1000 万 Token,可使用 DeepSeek、GLM、Minimax、Qwen 等主流模型

七牛云推出AI大模型推理体验活动,邀请好友可获500万Token,首次体验可得1000万Token,Token有效期两年。活动支持多种模型,并使用OpenAI兼容接口。

七牛云赠送 1000 万 Token,可使用 DeepSeek、GLM、Minimax、Qwen 等主流模型

小众软件
小众软件 · 2026-02-05T14:34:24Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码