小红花·文摘

本文介绍了使用chatglm2-6b模型在集团EA的P40机器上进行垂直领域的LORA微调。chatglm2-6b相比于chatglm有性能提升、更长的上下文、更高效的推理和更开放的协议。微调环境包括性能要求和镜像环境。LORA微调方法是冻结预训练模型权重参数，在加入额外的网络层并训练这些新增网络层参数。微调使用huggingface提供的peft工具。目前模型还在finetune中。

chatglm2-6b在P40上做LORA微调

京东科技开发者 ·

本文介绍了如何将云端服务接入ChatGLM，并在聆思CSK6大模型开发板上进行语音交互。首先需要创建应用并配置参数，然后进行部署验证。接下来，在聆思CSK6大模型开发板上创建产品并绑定云端应用和云端产品信息。然后将硬件设备ID加入设备列表，并将产品ID写入开发板固件中。最后，通过语音交互验证接入成功。

手把手教你用聆思CSK6大模型开发板接入智谱清言：ChatGLM

分享AI芯片开发经验 ·

华为云ModelArts提供全栈AI能力，LangChain＋ChatGLM3实现本地知识库问答。ModelArts是一站式AI开发平台，LangChain是开源框架，ChatGLM3是基于Transformer的预训练语言模型。ModelArts提供数据管理、模型训练和部署推理功能。LangChain的组件包括Models、Prompts、Indexs和Chains。通过RetrievalQA实现基于本地知识库的问答。

一文教你基于LangChain和ChatGLM3搭建本地知识库问答

华为云官方博客 ·

本文介绍了一种新的数学数据集和协议，提升了数学专用语言模型的性能。已公开模型检查点和数据集，促进进一步研究和发展。

ChatGLM-Math: 使用自我批评流程提高大型语言模型在数学问题求解中的能力

BriefGPT - AI 论文速递 ·

ChatGLM-RLHF是一种从人类反馈中进行强化学习的系统，通过收集人类偏好数据、训练奖励模型和优化策略等方式，解决了与人类偏好的对齐问题。在中文对齐任务中，与ChatGLM-SFT相比，ChatGLM-RLHF取得了平均15%的更多胜利。本研究实践了利用人类偏好与语言模型对齐的方法，并提供了RLHF实现中的挑战与解决方案的见解。

ChatGLM-RLHF：大型语言模型与人类反馈的对齐实践

BriefGPT - AI 论文速递 ·

Mac本地RAG文档问答——Llama2 & ChatGLM3(量化版) & Ollama

Anjhon’s Blog ·

文章讲述了使用某软件时遇到的问题和解决方法，包括缺少cudatoolkit和代码中的device_map参数设置。问题只在int4量化下出现，使用fp16精度全模型运行没有问题。

Chatglm3部署踩坑记录

晓空blog ·

华为云的昇思MindSpore大模型专题介绍了ChatGLM模型的训练优化过程，包括GLM模型架构、位置编码、自回归填充、多任务预训练和微调等技术。还介绍了使用MindSpore和ChatGLM进行推理的方法和应用场景。

万字带你了解ChatGLM

华为云官方博客 ·

Langchain-Chatchat 部署（默认ChatGLM-6B 模型，本地可用）

苍穹の下 ·

本文介绍了清华大学开发的ChatGLM3-6B大模型的部署和配置方法，该模型对中文支持友好，可以通过离线部署来保证信息安全。部署过程包括下载模型、配置环境和修改参数等步骤。演示效果显示，该模型在对话、工具和代码解释等方面表现良好。总体来说，ChatGLM3-6B大模型对中文支持度高，是一个可靠的解决方案。

离线AI聊天清华大模型(ChatGLM3)本地搭建

dotNET跨平台 ·

最近体验了ChatGLM2-6B和ChatGLM3-6B，记录了部署过程和测试功能。ChatGLM3-6B是智谱AI和清华大学联合发布的对话预训练模型，具有更强大的基础模型和更完整的功能支持。开源地址为https://github.com/THUDM/ChatGLM3。部署需要GPU服务器和FRP内网穿透。模型下载可通过HuggingFace或ModelScope。启动服务后，可使用基础Demo、OpenAI Demo和ChatGPT Next进行对话。还可在工具模式中自定义工具方法和在代码解释器模式中执行代码。