小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DeepSeek,该卸下扫地僧的枷锁了

DeepSeek是一家中国对冲基金,近年来在人工智能领域表现突出。其开源大模型DeepSeek Coder和67B语言模型在多项评测中表现优异,推动市场价格下降。尽管面临技术挑战和舆论压力,DeepSeek仍在不断创新,未来将专注于商业化和基础设施建设,努力成为稳定的服务提供者。

DeepSeek,该卸下扫地僧的枷锁了

爱范儿
爱范儿 · 2026-04-12T08:53:16Z

【TechWeb】4月8日消息,没有发布会、没有博客、没有官方推文,DeepSeek网页端悄然上线了“快速模式”和“专家模式”两个新选项。用户打开网页就能看到输入框上方新增了一颗“闪电”和一个“钻石”图标。鼠标悬停在对应模式按钮上方后,会浮现提示语:快速模式“适合日常对话,即时响应”,专家模式“擅长复杂问题,高峰需等待”。这看似简单的界面改动,实则是DeepSeek首次在产品端引入模式分层设...

实测DeepSeek最新“专家模式”有哪些能力?

TechWeb 全站精华
TechWeb 全站精华 · 2026-04-08T08:57:56Z
DeepSeek深夜更新后自曝:我是V4(?!)

DeepSeek更新推出了“快速模式”和“专家模式”,并暗示V4版本可能即将发布。快速模式适合简单对话,专家模式处理复杂任务。网友推测专家模式可能是V4的简化版,V4的正式发布或许不远。

DeepSeek深夜更新后自曝:我是V4(?!)

量子位
量子位 · 2026-04-08T03:58:24Z
刚刚,DeepSeek 大升级,V4 真的不远了|附体验细节

DeepSeek 网页端更新推出了快速模式和专家模式,快速模式适合日常对话,专家模式则更擅长处理复杂问题。尽管专家模式表现更佳,但功能有限。未来可能推出视觉模式,DeepSeek 正在探索产品分层以应对商业可持续性问题。

刚刚,DeepSeek 大升级,V4 真的不远了|附体验细节

爱范儿
爱范儿 · 2026-04-08T03:43:00Z
北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北京大学团队提出的新稀疏注意力机制HISA,速度提升2-4倍,几乎不损失精度。该机制通过块级粗过滤和块内精挑字符,降低索引器成本,适应超长文本需求,工程友好性强。测试结果显示HISA在速度和精度上表现优异,未来可进一步优化块特征计算和训练方式。

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

量子位
量子位 · 2026-04-06T15:25:48Z
告别 PDF 乱码错版,DeepSeek OCR 驱动,手机就能用:将扫描版 PDF 转换为 EPUB 电子书

小墨阅读器基于DeepSeek-OCR技术,解决手机PDF阅读难题,支持PDF转换为EPUB和Markdown,精准识别复杂内容,提供翻译和语音功能,适用于iOS和桌面端。

告别 PDF 乱码错版,DeepSeek OCR 驱动,手机就能用:将扫描版 PDF 转换为 EPUB 电子书

小众软件
小众软件 · 2026-04-02T11:36:09Z
基于.NET Core + Vue3构建的开源全栈平台Admin系统,集成 DeepSeek等AIGC大模型

这是一个基于.NET Core和Vue3的开源全栈管理系统,采用DDD和CQRS架构,支持图像识别和智能分析,具备高扩展性和安全性,适合企业级后台管理,并支持Docker和Kubernetes以满足自动化交付需求。

基于.NET Core + Vue3构建的开源全栈平台Admin系统,集成 DeepSeek等AIGC大模型

dotNET跨平台
dotNET跨平台 · 2026-03-31T00:01:57Z
DeepSeek网页版大升级!随后宕机11小时崩上热搜,新模型真的来了

DeepSeek网页版经历11小时宕机后,用户反馈模型能力显著提升。新版本DeepSeek-V3稳定性增强,知识截止更新至2026年1月。服务恢复后仍有小问题,但整体表现令人期待。

DeepSeek网页版大升级!随后宕机11小时崩上热搜,新模型真的来了

量子位
量子位 · 2026-03-30T03:33:58Z
谷歌TurboQuant碾压DeepSeek!通用压缩算法引芯片股暴跌

Google推出的TurboQuant算法将AI内存KV缓存压缩6倍,几乎无损失,提升速度与吞吐量,降低成本,重塑行业结构。这项技术使AI更便宜、更快,推动复杂应用的发展,同时可能增加内存需求,给内存厂商带来压力与机遇。

谷歌TurboQuant碾压DeepSeek!通用压缩算法引芯片股暴跌

极道
极道 · 2026-03-27T03:09:00Z
一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

Google Research 发布的 TurboQuant AI 压缩算法能够在不损失性能的情况下,将 AI 的工作记忆压缩至少 6 倍,解决显存瓶颈问题。该技术引发市场反应,导致存储芯片股价下跌。尽管前景广阔,但仍需克服训练阶段的显存消耗问题。

一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

爱范儿
爱范儿 · 2026-03-26T05:41:43Z
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先

DeepSeek近期开放17个Agent岗位,专注于算法研究、数据评测和基础设施,强调AI编程工具的使用。招聘需求显示其从基础模型研究转向Agent产品化,旨在构建完整的数据闭环能力,并计划在2025年发布高级Agent功能的AI模型。

DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先

量子位
量子位 · 2026-03-25T06:39:13Z
OpenClaw v2026.3.23更新解读:Qwen随用随付、DeepSeek捆绑变插件!

2026年3月23日,OpenClaw更新,DeepSeek成为可插拔插件,支持全球化的Qwen,提升AI模型灵活性与生态协作。OpenRouter优化模型选择,增强智能调度,改善与外部系统的交互,提升AI稳定性与可靠性,标志AI应用重大进步。

OpenClaw v2026.3.23更新解读:Qwen随用随付、DeepSeek捆绑变插件!

极道
极道 · 2026-03-24T06:04:00Z
大厂抢郭达雅进行时!DeepSeek核心成员还是个“综艺巨佬”

郭达雅是DeepSeek的核心工程师,以其卓越的科研和竞赛成绩受到关注。他在多项比赛中获奖,并参与多个重要模型的研发。此外,他还参加过综艺节目,展示了编程能力。离职后,他的去向引发热议。

大厂抢郭达雅进行时!DeepSeek核心成员还是个“综艺巨佬”

量子位
量子位 · 2026-03-22T07:03:33Z
全网猜了一周 DeepSeek V4,结果是小米干的

小米发布了三款新模型:Hunter Alpha、Healer Alpha 和 MiMo-V2 系列,旨在提升 AI 任务执行能力。Hunter Alpha 和 Healer Alpha 为内测版本,MiMo-V2-Pro 专注推理与规划,MiMo-V2-Omni 实现多模态感知,MiMo-V2-TTS 提供自然语音表达。这些模型将推动小米的智能生态战略。

全网猜了一周 DeepSeek V4,结果是小米干的

爱范儿
爱范儿 · 2026-03-19T08:12:42Z

【TechWeb】3月19日消息,...

谜底揭晓:全网猜了一周的“DeepSeek V4”,竟是小米自研王牌

TechWeb 全站精华
TechWeb 全站精华 · 2026-03-19T01:52:05Z
「日本最强AI」塌房了!扒开代码全是DeepSeek,日本网友集体破防

乐天集团发布的7000亿参数大模型Rakuten AI 3.0被指抄袭中国的DeepSeek-V3,仅进行了日文微调。尽管模型表现优异,乐天却未提及DeepSeek,甚至删除了相关开源协议,引发日本网友的不满,反映出日本在AI领域对中国技术的依赖。

「日本最强AI」塌房了!扒开代码全是DeepSeek,日本网友集体破防

爱范儿
爱范儿 · 2026-03-18T04:33:22Z

乐天集团因删除 DeepSeek-V3 的开源许可证而遭到批评,后重新添加 NOTICE 文件以补救,虽然符合 MIT 协议,但其做法仍被指不道德,引发争议。

日本乐天AI模型被网友发现违规删除DeepSeek开源许可证 现已重新补上许可证

蓝点网
蓝点网 · 2026-03-18T04:30:38Z
模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

在NVIDIA GTC展会上,我们展示了基于MAX框架的FLUX图像生成和Mojo编程的CUTLASS内核移植。DeepSeek V3在云端运行,提供实时指标,欢迎到3004号展位交流。

模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

Modular Blog
Modular Blog · 2026-03-16T00:00:00Z
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

开源模型迭代迅速,开发者希望低门槛部署新模型,但GPU成本和环境配置仍是障碍。HyperAI提供免费CPU配额和在线教程,帮助开发者快速体验模型。

在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

HyperAI超神经
HyperAI超神经 · 2026-03-10T03:46:25Z

DeepSeek R1 是中国 AI 公司推出的模型,采用纯强化学习实现自主推理,突破传统监督学习模式。R1-Zero 模型无需人类标注,展现出链式推理能力。GRPO 算法提升训练效率,简单的奖励系统驱动复杂推理策略。R1 的成功降低了推理模型的门槛,启发了新的研究方向,展示了纯强化学习的潜力,标志着 AI 训练的重要转变。

DeepSeek-R1:用纯强化学习解锁大语言模型的推理能力

Micropaper
Micropaper · 2026-03-01T22:30:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码