dotNET跨平台 ·

LLM探索：环境搭建与模型本地部署

💡 原文中文，约6900字，阅读约需17分钟。

📝

内容提要

本文介绍了两个国产开源LLM的本地部署，ChatGLM-6B和MOSS。MOSS对显存要求高，推理速度慢，需要使用量化模型和多卡加速。模型采用GNU AFFERO GENERAL PUBLIC LICENSE许可证，可以免费商用。

🎯

关键要点

本文介绍了两个国产开源LLM的本地部署：ChatGLM-6B和MOSS。
MOSS对显存要求高，推理速度慢，需要使用量化模型和多卡加速。
ChatGLM-6B是清华和智谱公司开发的开源LLM，支持中英双语，具有62亿参数。
ChatGLM-6B在消费级显卡上可进行本地部署，最低显存需求为6GB。
MOSS是复旦大学开发的开源对话语言模型，具有160亿参数，推理速度较慢。
MOSS在FP16精度下需要31GB显存，完成一轮对话需要42GB。
ChatGLM-6B的商用需要购买许可证，而MOSS采用GNU AFFERO GENERAL PUBLIC LICENSE许可证，可以免费商用。
搭建环境需要NVIDIA显卡和Linux系统，推荐使用Ubuntu。
Python环境建议使用conda管理，推荐使用miniconda3。

🏷️

继续阅读

在15分钟内使用Ollama运行本地AI模型
本文介绍了如何在15分钟内使用Ollama在本地运行小型语言模型。用户只需安装Ollama、下载模型（如Llama 3.2 3B）并开始聊天。Ollama...
在Kubernetes中使用vLLM运行自托管的大型语言模型（LLM）
本文介绍了在Kubernetes环境中自托管大型语言模型（LLM）的设置，使用vLLM作为推理引擎，LINSTOR提供持久存储。自托管可降低成本、提高控制...
RLinf v0.3来了！从模型生态到真机部署五大能力跃升，无问芯穹与清华大学联合打造
无问芯穹与清华大学联合研发的RLinf v0.3是全球首个支持具身智能持续进化的强化学习基础设施，解决了行业发展瓶颈。该平台实现了数据采集、管理和强化学习...
借美国民间的 National AI Day，聊聊 AI 如何成为新的生产力环境
文章讨论了美国的“国家人工智能日”，强调人工智能（AI）已成为新的生产力环境。AI不仅是工具，还参与工作实现，自动化重复劳动，提升效率。随着AI能力增强，...
Rime完成2400万美元A轮融资，旨在打造企业级语音AI模型
Rime完成2400万美元A轮融资，专注于构建自然、富有人情味的企业级语音对语音AI模型。公司强调语言学的重要性，已在实时电话通话领域处理近1亿次客户互动...
早报｜国行苹果AI要来了，将搭载千问模型/曝DeepSeek计划明年上市/Codex首款硬件发布
苹果等七款手机的端侧生成式AI服务已完成备案，阿里千问将集成至Apple智能。OpenAI发布Codex Micro硬件，售价约1556元。DeepSee...

内容提要

关键要点

标签

继续阅读