依云's Blog ·

给论坛用上了文本嵌入模型

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文探讨了Discourse论坛如何利用文本嵌入模型生成相关话题和语义搜索。作者尝试了多种模型，最终选择了适合中文的gte-base-zh和Qwen3-Embedding系列，其中0.6B版本在资源需求上表现较好。论坛的文本嵌入算力主要依赖群友提供的设备。

🎯

关键要点

Discourse论坛支持利用文本嵌入模型生成相关话题和语义搜索。
文本嵌入是将文本编码为向量以判断语义相关性，使用余弦距离和负内积等方法。
Discourse使用pgvector插件进行向量存储和索引。
作者尝试了多个模型，最终选择了适合中文的gte-base-zh和Qwen3-Embedding系列。
gte-base-zh模型小且资源需求低，适合在CPU上运行。
Qwen3-Embedding系列提供多种参数规模，0.6B版本在资源需求上表现较好。
群友提供的设备是论坛文本嵌入算力的主要来源。
在高负载情况下，某些设备的驱动可能会崩溃，影响性能。
作者尝试过Google的embeddinggemma-300M模型，但效果不佳，最终放弃。
目前论坛的文本嵌入算力主要由群友的RYZEN AI MAX+ 395提供，备用设备包括Apple M2 Ultra和x86编译机。

❓

延伸问答

Discourse论坛如何利用文本嵌入模型进行语义搜索？

Discourse论坛通过文本嵌入模型生成相关话题列表，并提供语义化搜索功能，用户可以通过搜索框进行相关话题的查找。

选择哪个文本嵌入模型适合中文？

作者最终选择了适合中文的gte-base-zh和Qwen3-Embedding系列模型，其中0.6B版本在资源需求上表现较好。

文本嵌入模型的工作原理是什么？

文本嵌入模型通过将文本编码为向量来判断语义相关性，使用余弦距离和负内积等方法进行相关性计算。

Discourse论坛的文本嵌入算力主要来源是什么？

论坛的文本嵌入算力主要依赖群友提供的设备，如RYZEN AI MAX+ 395和Apple M2 Ultra。

使用Qwen3-Embedding模型时遇到的性能问题是什么？

在高负载情况下，某些设备的驱动可能会崩溃，影响性能，尤其是amdgpu驱动在高负载时会重置。

为什么放弃使用Google的embeddinggemma-300M模型？

尽管embeddinggemma-300M模型的MTEB评分较高，但实际使用效果差，基本没有用，最终选择放弃。

🏷️

继续阅读

埃隆·马斯克确认xAI使用OpenAI的模型来训练Grok
埃隆·马斯克在加州法庭作证称，他的AI初创公司xAI使用了OpenAI的模型来提升技术。他提到“模型蒸馏”是行业常见做法，允许大型AI模型作为“教师”训练...
OpenAI的新安全模型仅面向‘关键网络防御者’
OpenAI即将推出新的网络安全模型GPT-5.5-Cyber，首批仅向“可信的网络防御者”发布。CEO萨姆·阿尔特曼表示，此次有限发布旨在增强机构的网络...
2026 年 3 月和 4 月该入手的模型手办
2026年3月和4月的特别作品主要包括《光能使者》系列的光能使者和超级光能使者，以及记录孙悟空和库林修行的龟仙屋，但缺少布尔玛和朗琪，显得不太完整。
DeepSeek识图模式是个新模型？！一手实测在此（没错我被灰度到了）
DeepSeek的识图模式在灰度测试中表现优异，支持快速识别和推理。非思考模式下速度快但准确性需提升；思考模式下推理能力强但耗时较长。该模式有效处理OCR...
本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集
Privacy Filter 是 OpenAI 开源的双向标记分类模型，专门用于检测和屏蔽文本中的个人身份信息。该模型基于小型预训练架构，采用高效的片段解码方式。
生数科技认领神秘登顶模型：AI视频公司拿出工业级Demo，跨本体跑通复杂长程任务
生数科技推出的MotuBrain是一款具身智能机器人通用大脑，具备世界模型的预测和行动能力，展现出卓越的物理理解和行动能力。MotuBrain通过统一建模...