摩尔线程通过SGLang等开源框架,推动国产GPU在大模型推理中的应用。此次Meetup展示了SGLang与MUSA的结合,解决了算子优化和生产部署问题,提升了性能和开发效率。摩尔线程致力于融入全球开源生态,成为核心代码的贡献者,推动国产GPU与主流框架的深度融合。
阿里开源Qwen3.5系列新模型,摩尔线程快速适配MTT S5000 GPU,展示MUSA生态的成熟。支持原生MUSA C和Triton-MUSA,优化混合注意力机制,提升推理性能。摩尔线程将继续推动国产算力发展,助力AI生态繁荣。
摩尔线程开源了TorchCodec-MUSA,实现了PyTorch编解码库的硬件适配,支持无缝迁移至国产GPU,提升视频处理效率,简化开发流程,降低使用门槛,推动国产GPU在AI训练中的应用。
摩尔线程开源MUSA加速版MONAI 1.5.0,专注于AI医学影像,提升国产算力。MONAI框架连接学术与临床,已下载350万次。MUSA软件栈优化性能,推动医学AI应用与国产生态发展。
摩尔线程在开发者大会上推出全新GPU架构MUSA,涵盖AI、图形和科学计算,发布三款新芯片和两款硬件产品,提升算力和能效,推动国产GPU生态发展,目标培养百万开发者。
摩尔线程发布了Torch-MUSA v2.7.0,增强了PyTorch深度学习框架的功能和性能,支持统一内存设备,算子超过1050个。新版本集成muSolver和muFFT,加速复杂计算,新增动态双精度转换和分布式检查点功能,优化内存使用和计算效率,未来将持续跟进PyTorch更新。
摩尔线程发布了Torch-MUSA v2.1.1,增强了对大规模深度学习模型的支持,优化了编译性能和内存管理,新增分布式训练和3D支持,简化了集成流程,提升了用户体验。
摩尔线程推出了大语言模型推理框架vLLM的MUSA移植版本,旨在为开发者提供基于摩尔线程GPU的开源项目示例。vLLM通过创新技术显著提升推理性能,开发者可利用MUSA架构简化CUDA代码迁移,提升开发效率,期待与更多开发者共同推动MUSA生态发展。
摩尔线程发布了Torch-MUSA v1.3.0,全面兼容PyTorch 2.2.0,提升模型性能并支持国产GPU,用户可轻松迁移模型。Torch-MUSA开源,鼓励开发者参与改进,未来将持续跟进PyTorch更新。
完成下面两步后,将自动完成登录并继续当前操作。