💡
原文中文,约700字,阅读约需2分钟。
📝
内容提要
在MacBook Pro上使用gpt-oss因内存限制运行困难。在显存为6G的Windows笔记本上使用lm studio运行gpt-oss 20b模型,加载8层后生成速度有所提升,但仍受显存限制,建议使用显存大于16G的显卡。
🎯
关键要点
- 在MacBook Pro上使用gpt-oss因内存限制运行困难。
- Windows笔记本配备3060显卡,显存为6G,尝试使用lm studio运行gpt-oss 20b模型。
- gpt-oss 20b模型有24层,官方显存需求为16G,6G显存可加载8~9层。
- 通过lm studio配置加载8层,生成速度可达到4.x个token,优于Mac上运行。
- 调整gpu卸载层数到9层勉强可行,显存不足限制了加载更多层。
- 可以使用unsloth进行微调,参考相关Colab链接。
- 通过nvidia-smi和nvitop监控显存占用,加载部分层提升生成速度,但仍受显存限制,建议使用显存大于16G的显卡。
➡️