摩尔线程与智源众智FlagOS社区合作,在MTT S5000 GPU上快速适配DeepSeek-V4-Flash模型。该模型采用混合专家架构,参数量达到284B,支持百万token上下文。MTT S5000原生支持FP8精度,提升计算效率。双方通过编译优化和自动调优,提升了FP8和Sparse Attention算子的性能,降低延迟并提高吞吐量。未来将继续推进DeepSeek-V4-Pro的适配工作。
众智FlagOS是一款开源AI系统软件栈,支持多种异构AI芯片,旨在帮助企业和开发者实现本地AI服务。与腾讯云HAI合作,FlagOS上线了Qwen3-4B模型镜像,简化了模型的快速部署,降低了云端服务的隐私风险和成本,推动了AI能力的自主可控发展。
AI短名单是对长篇文章的简要概述,旨在提炼出核心信息。
面壁智能推出的全模态大模型MiniCPM-o 4.5与众智FlagOS系统合作,实现对六大主流AI芯片的快速适配,推理性能显著优于原生方案。FlagOS提供高效的跨芯片软件栈,确保模型在多硬件上高效运行,推动AI技术广泛应用。
完成下面两步后,将自动完成登录并继续当前操作。