英特尔AMX助力阿里云提升推荐模型性能
本文详细介绍阿里云人工智能平台PAI团队研发的PAI-REC以白盒化的方式快速构建推荐全链路方案,帮助用户更好的落地深度学习推荐算法。
阿里云PAI团队研发了PAI-REC全链路解决方案,通过优化模型训练和推理,提升了推荐系统的速度和效率。采用英特尔® 第四代至强® 可扩展处理器Sapphire Rapids(SPR)和英特尔® AMX技术,提高了矩阵乘法的计算效率。使用BFloat16浮点格式和算子融合优化,降低了内存占用和计算开销。通过特征计算优化和图优化,进一步提升了性能。阿里云和英特尔将继续合作,探索创新方式来优化软硬件集成,提升深度学习模型的性能。