基于飞桨框架3.0单机部署 DeepSeek-R1-Distill-Qwen-14B 实战
飞桨框架3.0发布了,有很多新特性,包括但不限于: 1)动静统一自动并行:通过少量的张量切分标记,即可自动完成 […]
飞桨框架3.0发布,新增动静统一自动并行、大模型训推一体和高阶微分等特性。支持多硬件推理,优化性能,特别是DeepSeek模型的推理能力显著提升,单机每秒输出token数超过1000,4比特方案可达2000,解码速度和吞吐量均有显著改善。

飞桨框架3.0发布了,有很多新特性,包括但不限于: 1)动静统一自动并行:通过少量的张量切分标记,即可自动完成 […]
飞桨框架3.0发布,新增动静统一自动并行、大模型训推一体和高阶微分等特性。支持多硬件推理,优化性能,特别是DeepSeek模型的推理能力显著提升,单机每秒输出token数超过1000,4比特方案可达2000,解码速度和吞吐量均有显著改善。