💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

浪潮信息推出的NF8260G7和NF8480G7元脑CPU推理服务器,支持DeepSeek和QwQ等大模型,具备高效算力和并发处理能力,适合企业快速部署AI应用。

🎯

关键要点

  • 浪潮信息推出NF8260G7和NF8480G7元脑CPU推理服务器,支持DeepSeek和QwQ等大模型。
  • 服务器采用4颗高性能通用CPU和多通道内存系统,具备高效算力和并发处理能力。
  • 单机可支持20个并发用户请求,适合企业快速部署AI应用。
  • 服务器通过软硬协同优化,为32B模型推理与云计算、数据库等场景提供高效支持。
  • NF8260G7和NF8480G7已完成与DeepSeek-R1 32B和QwQ-32B的深度适配和优化。
  • 服务器设计采用4颗32核心的英特尔至强处理器6448H,支持张量并行计算。
  • 具备超强的BF16精度AI推理能力和高内存容量及带宽,满足模型计算和存储需求。
  • 对主流企业级大模型推理服务框架vLLM进行深度定制优化,效率提升4倍,解码性能提升2倍。
➡️

继续阅读