小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
DeepSeek 与开源:肥沃土壤孕育 AI 硕果

中国开源生态经过二十年的发展,从零散探索到繁荣,推动了国产AI技术的崛起。DeepSeek等项目的成功得益于开源社区的积累与协作。尽管面临国际竞争,国内开源仍需持续发展,以实现更大技术突破。

DeepSeek 与开源:肥沃土壤孕育 AI 硕果

Gitee 官方博客
Gitee 官方博客 · 2026-01-23T07:19:54Z

百万围观、HuggingFace多模态登顶,华人团队开源语音版「DeepSeek」海外爆火

机器之心
机器之心 · 2026-01-23T03:56:58Z

幻觉率不到3%,王小川把医生版的DeepSeek免费了

机器之心
机器之心 · 2026-01-22T11:17:35Z

智谱AI推出新模型GLM-4.7-Flash,参数300亿,激活仅30亿,适用于本地编程和智能助手。该模型在代码修复测试中表现优异,支持200K上下文窗口,兼容多平台,并可在苹果M5上运行。API免费开放,具备创意写作和翻译功能。

智谱新模型也用DeepSeek的MLA,苹果M5就能跑

量子位
量子位 · 2026-01-20T09:19:49Z
DeepSeek R1发布一年了,不卷功能、不融资、不着急,凭什么「硬控」硅谷

DeepSeek R1发布一年,尽管下载量下降,但在AI领域仍具影响力。其母公司幻方量化支持零融资策略,专注技术而非商业化。DeepSeek通过高效模型挑战硅谷巨头,预计将在农历新年发布新模型V4,继续推动AI发展。

DeepSeek R1发布一年了,不卷功能、不融资、不着急,凭什么「硬控」硅谷

爱范儿
爱范儿 · 2026-01-20T07:19:32Z

谷歌研究表明,DeepSeek-R1等推理模型在解题时会自发产生不同性格的虚拟人格,通过内部对话增强推理能力。在面对复杂任务时,这种“脑内群聊”更加活跃,从而提高了模型的准确性,类似于人类的社交思维。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

量子位
量子位 · 2026-01-20T05:01:03Z

继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人

机器之心
机器之心 · 2026-01-14T06:45:50Z

DeepSeek母公司幻方量化去年盈利50亿,支持AGI研究。尽管未融资,DeepSeek持续发表高水平论文,团队稳定,研发投入低,未来发展前景乐观。

DeepSeek母公司去年进账50亿,够烧2380个R1

量子位
量子位 · 2026-01-13T07:56:54Z
DeepSeek公布全新论文,梁文锋署名

DeepSeek发布论文《条件记忆》,提出将“条件记忆”作为大语言模型的新稀疏维度,以解决知识检索的低效问题。研究表明,结合条件记忆与混合专家(MoE)可显著提升模型性能,特别是在知识推理和代码生成方面。预计新模型DeepSeek V4将应用此技术,进一步增强AI竞争力。

DeepSeek公布全新论文,梁文锋署名

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-13T06:03:09Z

许多改变世界的产品,如DeepSeek、Qwen和ChatGPT,最初都是不被重视的支线项目。这些项目因缺乏管理和约束,能够自由探索和创新,最终取得成功。在AI时代,支线项目的探索成本低、反馈快,可能成为未来发展的重要信号。

DeepSeek等8大产品都是意外?!改变世界的项目们最初都没当事儿办

量子位
量子位 · 2026-01-11T12:02:11Z

DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

机器之心
机器之心 · 2026-01-10T12:56:25Z

DeepSeek V4预计春节前发布,专注编码能力,测试结果显示超越现有模型,在超长代码处理和数据理解上有显著突破,生成答案逻辑更清晰,推理能力增强。

DeepSeek V4爆料:春节档GPT/Claude编程危

量子位
量子位 · 2026-01-10T01:27:28Z
早报|曝库克透露苹果最快今年换帅/DeepSeek新模型或春节前后推出/多家平台回应外卖内卷竞争调查

外卖竞争调查启动,美团、淘宝、京东表示支持。苹果Apple Watch房颤功能获批,拼多多春节加班激励曝光。库克去年薪酬7429万美元,苹果加速CEO继任计划。王腾新公司招聘不招应届生,主攻研发。微软否认裁员传言,特斯拉开源车衣设计模板。

早报|曝库克透露苹果最快今年换帅/DeepSeek新模型或春节前后推出/多家平台回应外卖内卷竞争调查

爱范儿
爱范儿 · 2026-01-10T01:00:47Z

一年后,DeepSeek-R1的每token成本降到了原来的1/32

机器之心
机器之心 · 2026-01-09T06:24:01Z

DeepSeek发布了R1技术报告的64页补充内容,详细介绍了模型训练路径和安全性评估。新版本涵盖冷启动、推理导向RL等四个步骤,提升了模型的推理能力和安全性,团队成员流失少,显示出良好的内部稳定性。

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

量子位
量子位 · 2026-01-08T12:18:07Z
DeepSeek-V3.2在推理任务上超越GPT-5

DeepSeek发布了DeepSeek-V3.2开源AI模型,性能超过GPT-5,采用稀疏注意力机制和强化学习等新技术。尽管表现优异,但在知识广度和复杂任务解决上仍不及封闭模型,未来将致力于优化模型效率和知识积累。

DeepSeek-V3.2在推理任务上超越GPT-5

InfoQ
InfoQ · 2026-01-06T14:00:00Z
英伟达罕见不发显卡,刚刚黄仁勋带着2.5吨新「核弹」炸场,DeepSeek又被点名

在CES上,英伟达首次未发布消费级显卡,CEO黄仁勋介绍了新AI计算平台Vera Rubin,重设计六款芯片以加速AI训练。新平台性能显著提升,支持物理AI和开源模型,并展示了自动驾驶技术Alpamayo,强调AI在现实世界的应用潜力。

英伟达罕见不发显卡,刚刚黄仁勋带着2.5吨新「核弹」炸场,DeepSeek又被点名

爱范儿
爱范儿 · 2026-01-06T01:56:26Z
我让ChatGPT、Claude和DeepSeek来制作俄罗斯方块

在测试三款AI模型(Claude Opus 4.5、GPT-5.2 Pro和DeepSeek V3.2)编写俄罗斯方块游戏时,Opus 4.5表现最佳,代码运行顺利。GPT-5.2 Pro智能但首次尝试出现布局错误,体验不佳。DeepSeek V3.2成本最低,但需多次调试才能正常运行。总体来看,Opus 4.5适合日常编码任务。

我让ChatGPT、Claude和DeepSeek来制作俄罗斯方块

KDnuggets
KDnuggets · 2026-01-05T18:47:53Z

通过赋予 LLM 特定角色和回答范围(如仅限法律领域),可以帮助其理解具体需求的场景上下文,从而提供更优质的输出。

生成式大语言模型(LLM:eg:deepseek)用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z

撰写高质量输入的一些技巧LLM 的本质是一个输入输出程序软件体,这意味着:

1-AiLearning:生成式大语言模型(LLM:eg:deepseek)的用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码