HyperAI超神经 ·

【vLLM 学习】Load Sharded State

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

`local_state_dict` 在 PyTorch 中用于分布式训练的参数保存与加载，特别适合完全分片数据并行（FSDP）。使用时需确保模块结构兼容。示例代码展示了如何高效管理局部状态字典的保存与加载。

🎯

❓

local_state_dict 是 PyTorch 中用于分布式训练的参数保存与加载，特别适合完全分片数据并行（FSDP）。

使用 local_state_dict 时需确保模块结构兼容，复杂的嵌套模块可能会遇到兼容性问题。

local_state_dict 仅限于完全分片数据并行（FSDP），其他类型的分布式设置可能不支持该方法。

可以通过调用 model.local_state_dict() 方法保存局部状态字典，并使用 model.load_local_state_dict() 方法加载。

保存局部状态字典时，需确保所有进程同步，且仅在 rank 0 进程上保存。

加载局部状态字典时，需要将加载的字典重新分配给相应的 GPU 设备上的模型实例。

🏷️

网友吐槽：OpenClaw又触发了Claude Code当场翻脸还扣钱！
有趣的是，如果你最近的提交中在 JSON 数据块里提到了 OpenClaw，Claude Code 要么会拒绝你的请求，要么会额外收费。一句“openc...
Christophe Pettus: On pgvectorscale, and Hybrid Search Without an Elasticsearch Sidecar
pgvector is excellent. It is also, at large scale, expensive — because the HN...
保罗·梅尔基奥雷：Posette 2026
Posette 2026是一个免费的虚拟开发者活动，专注于PostgreSQL生成列的应用与演变。活动将通过实际案例探讨生成列的性能、存储和查询行为，并结...
OpenClaw v2026.4.29：从消息控制到记忆系统彻底进化
OpenClaw v2026.4.29版本改进了自动化对话、记忆系统和基础设施稳定性。新增的active-run引导和visible-reply机制增强了...
Roblox的日活跃用户持续下降，年龄检查减缓了增长
Roblox的日活跃用户在过去六个月减少了2000万，降至1.32亿，主要因实施年龄检查导致新用户增长放缓。尽管如此，Roblox的收入仍增长至14亿美元...
国会继续推迟监控改革
美国国会将《外国情报监视法》第702条延长45天，以便进行改革谈判。尽管有小幅改革，但未包含备受争议的搜查令要求，隐私倡导者对此表示失望。国会需在2026...