英特尔 OpenVINO 2025.0 带来对 Deepseek 模型的支持和更佳的 AI 性能

实时互动网 ·

英特尔 OpenVINO 2025.0 带来对 Deepseek 模型的支持和更佳的 AI 性能

💡 原文中文，约800字，阅读约需2分钟。

📝

内容提要

英特尔发布了 OpenVINO 2025.0，支持 Deepseek 和其他大型语言模型，提升了性能，新增 Qwen 2.5 模型。该工具包在 CPU 和 GPU 上优化了 whisper 模型，并支持 PyTorch API，改进了 LLM 的延迟，兼容新处理器和 Triton 推理服务器。

🎯

关键要点

英特尔发布了 OpenVINO 2025.0，支持 Deepseek 和其他大型语言模型。
新增支持的模型包括 Qwen 2.5、Deepseek-R1-Distill-Llama-8B 等。
OpenVINO 2025.0 在 CPU 和 GPU 上优化了 whisper 模型性能。
支持 PyTorch API，英特尔 NPU 初步支持 torch.compile。
改进了 LLM 的第二个令牌延迟，启用了 KV 缓存压缩。
支持 Core Ultra 200H 处理器和 Triton 推理服务器。
OpenVINO 模型服务器可以在 Windows Server 部署上本地运行。

🏷️

继续阅读

上下文衰退如何影响企业AI和大型语言模型（LLM）的结果，以及如何解决这一问题
上下文衰退影响企业AI和大型语言模型（LLM）的表现。旧数据未被清除，导致信息混乱和推理能力下降。企业需监控关键数据指标，清除过时数据，以提升AI的准确性和效率。
真机测试显示微软最新开发的原生NVMe驱动程序对固态硬盘的性能提升极其显著
Windows 11和Windows Server 2025的NVMe驱动程序显著提升了4K和64K随机读取性能，降低了CPU使用率和延迟。用户需通过注册...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
如果你三年前购买了笔记本电脑，苹果的新M5 Max感觉像是一次巨大的升级
M5 Max在性能上显著优于M2 Max，单核性能提升55%，多核性能几乎翻倍，GPU渲染性能提升64%，在Premiere Pro中4K导出时间减少30%。
Intention Is All You Need
文章《AI 是一种编程框架》强调了意图在软件开发中的重要性。随着大型语言模型（LLM）的出现，开发者可以直接将意图转化为软件，简化了开发流程，程序员只需表...
厦门首场OpenClaw线下聚会圆满收官，看200+开发者如何“钳”住未来
基于PaddleFormers的DeepSeek-V3模型微调与优化实践取得显著成果，积累经验，确保参数独立性，提升模型性能。

英特尔 OpenVINO 2025.0 带来对 Deepseek 模型的支持和更佳的 AI 性能

内容提要

关键要点

标签

继续阅读