LLM探索:环境搭建与模型本地部署

💡 原文中文,约6900字,阅读约需17分钟。
📝

内容提要

本文介绍了两个国产开源LLM的本地部署,ChatGLM-6B和MOSS。MOSS对显存要求高,推理速度慢,需要使用量化模型和多卡加速。模型采用GNU AFFERO GENERAL PUBLIC LICENSE许可证,可以免费商用。

🎯

关键要点

  • 本文介绍了两个国产开源LLM的本地部署:ChatGLM-6B和MOSS。
  • MOSS对显存要求高,推理速度慢,需要使用量化模型和多卡加速。
  • ChatGLM-6B是清华和智谱公司开发的开源LLM,支持中英双语,具有62亿参数。
  • ChatGLM-6B在消费级显卡上可进行本地部署,最低显存需求为6GB。
  • MOSS是复旦大学开发的开源对话语言模型,具有160亿参数,推理速度较慢。
  • MOSS在FP16精度下需要31GB显存,完成一轮对话需要42GB。
  • ChatGLM-6B的商用需要购买许可证,而MOSS采用GNU AFFERO GENERAL PUBLIC LICENSE许可证,可以免费商用。
  • 搭建环境需要NVIDIA显卡和Linux系统,推荐使用Ubuntu。
  • Python环境建议使用conda管理,推荐使用miniconda3。
➡️

继续阅读