💡 原文中文,约1000字,阅读约需3分钟。
📝

内容提要

英特尔发布了 OpenVINO 2026.0,增强了对大型语言模型的支持,改进了酷睿 Ultra NPU 的兼容性,新增多种模型执行支持,并提升转录和字幕功能的准确性。同时,该版本优化了内存需求和性能,支持提前编译,以加速集成和价值实现。

🎯

关键要点

  • 英特尔发布了 OpenVINO 2026.0,增强了对大型语言模型的支持。
  • 改进了对英特尔酷睿 Ultra NPU 的兼容性。
  • 新增对 GPT-OSS-20B、MiniCPM-V-4_5-8B 和 MiniCPM-o-2.6 模型的 CPU 和 GPU 执行支持。
  • OpenVINO 现在支持词级时间戳,提升转录和字幕功能的准确性。
  • 支持针对 3D MatMuls 的 int4 数据感知权重压缩,降低内存/带宽需求并提高精度。
  • 增强了 Agentic AI 框架与 OpenVINO GenAI 的集成,支持 NPU 上的推测性解码。
  • 提供与 NPU 插件的编译器集成,支持提前编译和设备端编译。
  • 目标是提供一个单一的、可立即交付的软件包,以减少集成摩擦并加快价值实现速度。
➡️

继续阅读