蓝点网 ·

微软将DeepSeek-R1 7B和14B版引入Copilot AI PC 使用NPU单元在本地运行

💡 原文中文，约900字，阅读约需3分钟。

📝

内容提要

微软推出 DeepSeek-R1 7B 和 14B 模型，用户可在 Copilot+PC 上通过本地 NPU 单元离线运行 AI。目前速度较慢，1.5B 版为 40 tokens/秒，14B 版仅 8 tokens/秒，未来将优化并支持更多设备。

🎯

关键要点

微软推出 DeepSeek-R1 7B 和 14B 模型，用户可在 Copilot+PC 上通过本地 NPU 单元离线运行 AI。
目前 1.5B 版速度为 40 tokens/秒，14B 版速度仅为 8 tokens/秒，速度较慢。
微软计划将 DeepSeek-R1 模型的 NPU 优化版引入搭载高通骁龙 X 处理器的 Microsoft Copilot PC。
DeepSeek-R1 7B 和 14B 精简版模型通过 Microsoft Azure AI Foundry 提供，支持本地运行 AI 任务。
本地运行 AI 模型可以延长设备续航时间，且用户无需通过 API 付费。
微软使用内部自动量化工具 Aqua 将 DeepSeek 模型量化为 int4 权重。
未来微软将继续优化模型以提高速度，并将推送给搭载英特尔和 AMD NPU 单元的设备。
不具备 NPU 单元的设备暂时无法使用此类人工智能。

❓

延伸问答

DeepSeek-R1 模型的主要功能是什么？

DeepSeek-R1 模型允许用户在 Copilot+PC 上通过本地 NPU 单元离线运行 AI 模型。

目前 DeepSeek-R1 7B 和 14B 版的运行速度如何？

1.5B 版速度为 40 tokens/秒，14B 版速度仅为 8 tokens/秒，速度较慢。

使用 DeepSeek-R1 模型的好处有哪些？

用户可以在本地运行 AI 模型，延长设备续航时间，并且无需通过 API 付费。

微软计划如何优化 DeepSeek-R1 模型？

微软计划继续优化模型以提高速度，并将推送给搭载英特尔和 AMD NPU 单元的设备。

DeepSeek-R1 模型是如何量化的？

微软使用内部自动量化工具 Aqua 将 DeepSeek 模型量化为 int4 权重。

哪些设备可以使用 DeepSeek-R1 模型？

只有搭载 NPU 单元的设备可以使用 DeepSeek-R1 模型，不具备 NPU 单元的设备暂时无法使用。

🏷️

继续阅读

五种强大的Python装饰器，构建整洁的AI代码
本文介绍了五种实用的Python装饰器，旨在提高AI和机器学习代码的整洁性。这些装饰器包括：限制并发请求、结构化日志记录、特征注入、确定性种子设置和开发模...
商汤杨帆谈AI拐点：从人用AI到人机协作，本质是生产关系重构
武汉举办“线上搓虾子线下嘬虾子”活动，结合科技创新与消费，推动产业转型。商汤科技杨帆指出，产业正从算力时代转向智能时代，AI与人类深度协作成为新趋势。商...
browser-harness：让 AI 直接接管你的浏览器
browser-harness 是一个开源项目，允许 AI 通过 Chrome DevTools Protocol 控制浏览器。该项目包含 daemon....
69个开源AI工具大盘点2026年4月版 - 省下每年5万美金订阅费的开源方案
2026年4月，推荐了69个开源AI工具，包括Ollama、vLLM、LM Studio等，适用于本地运行大模型和推理引擎，帮助用户每年节省高达5万美元的...
拆解微软、谷歌、亚马逊、Meta最新财报：AI变现进入验证期 | 全球深一度
2026年第一季度，微软、谷歌、亚马逊和Meta四大科技巨头财报显示强劲增长。谷歌营收接近1100亿美元，微软AI业务年化收入达370亿美元。市场关注AI...
世界最差程序员变得主动：构建一个破解排行榜的AI
一位自称“世界最差程序员”的新手，通过AI工具学习编程，成功创建了一个连接公司知识库的代理，帮助他在内部排行榜上获得第一名。尽管编程仍然困难，但这个项目让...