💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
英特尔发布了 OpenVINO 2026.0,增强了对大型语言模型的支持,改进了酷睿 Ultra NPU 的兼容性,新增多种模型执行支持,并提升转录和字幕功能的准确性。同时,该版本优化了内存需求和性能,支持提前编译,以加速集成和价值实现。
🎯
关键要点
- 英特尔发布了 OpenVINO 2026.0,增强了对大型语言模型的支持。
- 改进了对英特尔酷睿 Ultra NPU 的兼容性。
- 新增对 GPT-OSS-20B、MiniCPM-V-4_5-8B 和 MiniCPM-o-2.6 模型的 CPU 和 GPU 执行支持。
- OpenVINO 现在支持词级时间戳,提升转录和字幕功能的准确性。
- 支持针对 3D MatMuls 的 int4 数据感知权重压缩,降低内存/带宽需求并提高精度。
- 增强了 Agentic AI 框架与 OpenVINO GenAI 的集成,支持 NPU 上的推测性解码。
- 提供与 NPU 插件的编译器集成,支持提前编译和设备端编译。
- 目标是提供一个单一的、可立即交付的软件包,以减少集成摩擦并加快价值实现速度。
➡️