阿里云云栖号 ·

通义千问开源模型在PAI灵骏的最佳实践

💡 原文中文，约18900字，阅读约需45分钟。

📝

内容提要

通义千问开源四款不同尺寸的语言模型，展示了在阿里云PAI灵骏智算服务上的高效分布式预训练、微调和推理验证。文章提供了资源开通、环境配置、模型准备和数据准备的指南，介绍了模型格式转换和离线推理的方法，以及使用PAI-EAS将模型部署为在线服务。

🎯

关键要点

通义千问开源四款不同尺寸的语言模型：1.8B、7B、14B、72B。
阿里云PAI灵骏智算服务提供高效的深度学习支持，包括预训练、微调和推理验证。
以Qwen-7B为例，展示了基于Megatron-LM的训练流程，支持多种技术以提升训练效率。
提供了资源开通和环境配置的指南，包括模型参数量和推荐资源配置。
用户可通过ModelScope、Huggingface和OSS对象存储下载Qwen-7B模型。
数据准备建议在PAI灵骏智算服务中的DSW实例中进行，提供了wudao2.0数据集的准备流程。
Megatron-LM训练数据准备包括数据清洗、格式转换和MMAP格式预训练数据集制作。
提供了小规模预处理数据的下载链接，方便用户试用。
模型格式转换脚本可将huggingface格式的模型转换为megatron格式。
继续预训练和微调的脚本参数设置详细说明，支持单机和分布式任务。
模型训练完成后，可进行离线推理，支持HuggingFace和Megatron-LM两种推理方式。
在线服务部署步骤包括开通阿里云PAI服务、准备资源组和部署模型服务。
提供了服务管理和调用的相关信息，确保用户能够顺利使用模型服务。

🏷️

继续阅读

Cloudflare收购VoidZero：开放网络的一部分是变得更加稳定，还是变得更加脆弱？
Cloudflare本周宣布收购VoidZero，并承诺其开发工具Vite将继续保持开源和社区驱动。尽管开发者对此反应不一，Cloudflare表示将致力...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
Crown Engine 0.63 恢复了其 OpenGL 渲染器，以支持旧版硬件
Crown Engine 0.63 是一款基于 C++ 的开源游戏引擎，新增 LOD 组组件以优化性能，并支持 OBJ 网格格式。更新改进了 FBX 导入...
当 AgentGateway 遇上 OpenClaw.NET：企业级智能体基础设施的深度协同实战 - 张善友
2026年，Linux基金会的智能体AI基金会将AgentGateway作为核心项目，提供统一的流量管理方案。AgentGateway与OpenClaw....
传奇黑客 Geohot 炮轰 AI Agent：这是软件工程史上代价最昂贵的灾难！
传奇黑客Geohot批评AI Agent，称其为软件工程史上最昂贵的错误。他认为AI无法有效编写高质量代码，导致开发者提交大量垃圾代码，影响系统稳定性。企...

通义千问开源模型在PAI灵骏的最佳实践

内容提要

关键要点

标签

继续阅读