HyperAI超神经 ·

【vLLM 学习】Torchrun Example

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

本文介绍了使用torchrun进行张量并行推理的实验性支持，包括运行命令和示例代码，展示了如何创建提示和采样参数以生成输出，并提到跨进程传递控制消息的技巧。

🎯

关键要点

本文介绍了使用torchrun进行张量并行推理的实验性支持。
运行命令为：`torchrun --nproc-per-node=2 torchrun_example.py`，参数2需与`tensor_parallel_size`一致。
示例代码展示了如何创建提示和采样参数以生成输出。
使用`distributed_executor_backend="external_launcher"`配置，确保LLM引擎仅创建一个工作进程。
所有rank将具有相同的输出。
跨进程传递控制消息时，建议使用基于GLOO后端的CPU组。

❓

延伸问答

如何使用torchrun进行张量并行推理？

使用命令`torchrun --nproc-per-node=2 torchrun_example.py`，参数2需与`tensor_parallel_size`一致。

示例代码中如何创建提示和采样参数？

示例代码中使用`prompts`列表创建提示，并使用`SamplingParams`类设置采样参数，如温度和top_p。

在使用torchrun时，如何确保LLM引擎只创建一个工作进程？

通过配置`distributed_executor_backend="external_launcher"`来确保LLM引擎仅创建一个工作进程。

跨进程传递控制消息时，推荐使用什么？

建议使用基于GLOO后端的CPU组来跨进程传递控制消息。

所有rank的输出是否相同？

是的，所有rank将具有相同的输出。

如何在rank 0执行特定操作？

可以通过检查`torch_rank`是否为0来执行特定操作，例如将结果保存到磁盘。

🏷️

继续阅读

C# OnnxRuntime 部署 DAViD 软前景分割
本文介绍了如何使用DAViD模型进行图像处理。用户可以选择图片，模型将其缩放至512x512并进行推理，生成带透明背景的图像，支持PNG、JPEG和BMP格式的保存。
如何跟孩子讲学习的意义
文章探讨了向孩子解释学习意义的重要性，强调学习是获取知识和技能以适应社会需求的过程。学习不仅是应对考试，更是提升个人能力，增加选择的途径。作者提及义务教育...
【2026 AI硬件开发学习必看系列】快速通过MCP让你的桌面宠物学会摇尾巴（语音控制舵机）
本文介绍了如何使用MCP工具通过语音指令控制LS26（Arcs-mini）开发板上的MG90S舵机。用户可以通过四次点击按钮启动或停止舵机旋转，并通过云端...
【2026 AI硬件开发学习必看系列】：智能硬件接入私有MCP服务变身私厨助手
MCP（模型控制与服务编排）是为智能硬件设计的AI服务调度框架，提供安全、快速、可控的接入方式，适用于校园、智能家居及行业专用硬件。接入私有服务的步骤包括...
【2026 AI硬件开发学习必看系列】通过MCP给AI语音助手加上温湿度测量播报功能
本文介绍了如何使用MCP工具为AI语音助手添加温湿度测量功能。以LS26开发板为例，教程指导用户通过语音指令控制I2C通信，读取AHT10传感器数据，并实...
【2026 AI硬件开发学习必看系列】智能硬件接入开放MCP服务变身购物助手
开放MCP服务为智能硬件提供便捷的AI能力接入，降低开发成本。用户可通过LS26开发板快速接入百度优选服务，创建购物推荐助手。接入步骤包括创建应用、注册百...