京东科技开发者 ·

ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知识库体验 | 京东云技术团队

💡 原文中文，约7600字，阅读约需18分钟。

📝

内容提要

本文介绍了如何下载离线embedding模型以及如何启用本地离线模型，同时介绍了基于LLM模型的ChatGLM-6B语言模型和基于本地知识库的问答应用。建议按需购买算力，使用京东Ku+平台即可。文章还比较了Gradio和Streamlit两个展示层框架的优劣，适用于不同场景的开发者。

🎯

关键要点

本文介绍了如何下载离线embedding模型和启用本地离线模型。
介绍了基于LLM模型的ChatGLM-6B语言模型，支持中英双语。
建议按需购买算力，使用京东Ku+平台。
比较了Gradio和Streamlit两个展示层框架的优劣。
ChatGLM-6B模型可在消费级显卡上进行推理和训练。
硬件要求建议使用16GB以上的GPU，或25GB内存的CPU。
软件环境要求包括CUDA 11.7+和Python 3.10.8+。
提供了详细的模型下载和安装步骤。
介绍了VisualGLM-6B，一个支持图像理解的多模态对话语言模型。
介绍了基于langchain的本地知识库问答应用的实现过程。
强调了模型的配置和使用方法，包括embedding和llm路径的设置。
对比了LLM回答和LLM+知识库的效果。
总结了Gradio和Streamlit的适用场景和优缺点。

🏷️

继续阅读

Ollama利用苹果的MLX框架加速Mac上的本地AI模型
该项目的快速增长引发关注。安全研究人员发现，代理系统在运行时决策、工具链和多服务交互中存在风险，可能导致数据泄露和提示注入，尤其在控制有限或定义不清的情况下。
社区速递 135 | 派友热议养「小龙虾」、3M 隔音耳罩与百乐钢笔体验
少数派 Matrix 社区重启周报，分享社区内容。派友们对AI助手“小龙虾”的使用体验提出了不同看法，认为其功能和成本存在问题。下期讨论将聚焦淘汰设备的新用途。
Floatboat 体验：一个人的公司，只需要一个办公软件
Floatboat是一款新型AI办公产品，旨在简化用户与AI的互动。它自动生成邀请函等功能，减少用户准备工作，并结合文件管理、浏览器和AI聊天工具，提供共...
Page Agent体验记：用 JS 语言操控网页的自动任务(有彩蛋)
page-agent 是一个纯 JS 实现的 GUI 代理，允许用户通过自然语言与网页应用互动。网站所有者只需引用 JS 代码，访客即可使用聊天框功能。个...
如何构建一个使用浏览器和Claude API的本地SEO审计代理
本文介绍了如何使用Python构建本地SEO审计代理，该代理通过真实浏览器访问网页，提取SEO信号、检查断链并生成结构化报告。支持中断恢复，运行成本低于每...
OkCupid与面部识别公司达成和解，承认共享用户照片的指控
FTC指控OkCupid和Match隐瞒与Clarifai的关系，尽管未处以罚款，两公司承诺未来不误导数据收集政策，并接受合规监测。

ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知识库体验 | 京东云技术团队

内容提要

关键要点

标签

继续阅读