小红花·文摘

本文介绍了如何在同一GPU上协同部署vLLM工作进程与训练执行器，适用于类RLHF应用。通过设置环境变量和使用CUDA-IPC传递张量，实现多个进程间的高效通信。