小红花·文摘 - 小红花技术领袖俱乐部

Antony Pegg：如何通过API在pgEdge Cloud上构建RAG服务器

Antony Pegg：如何通过API在pgEdge Cloud上构建RAG服务器

Planet PostgreSQL ·

微软发布全新的多语言嵌入模型 Harrier-OSS-v1，为多种语言提供高质量的语义表示

微软发布全新的多语言嵌入模型 Harrier-OSS-v1，为多种语言提供高质量的语义表示

实时互动网 ·

利用LLM嵌入构建语义搜索

MachineLearningMastery.com ·

Voyage 4模型系列：采用混合专家架构的共享嵌入空间

Voyage 4模型系列：采用混合专家架构的共享嵌入空间

Voyage AI ·

10种在表格机器学习任务中使用嵌入的方法

10种在表格机器学习任务中使用嵌入的方法

MachineLearningMastery.com ·

MANZANO：一个简单且可扩展的统一多模态模型，采用混合视觉标记器

MANZANO：一个简单且可扩展的统一多模态模型，采用混合视觉标记器

Apple Machine Learning Research ·

BGE系列模型包括多语言文本嵌入模型BGE-M3和重排序模型BGE-Reranker-v2-M3，支持高效推理。TEI框架简化了模型部署，适用于自然语言处理任务。结合TEI和vLLM可构建高性能AI应用，提升检索和生成的准确性与效率。

常用AI模型介绍及多模型组合使用场景

安志合的学习博客 ·

本文探讨了Discourse论坛如何利用文本嵌入模型生成相关话题和语义搜索。作者尝试了多种模型，最终选择了适合中文的gte-base-zh和Qwen3-Embedding系列，其中0.6B版本在资源需求上表现较好。论坛的文本嵌入算力主要依赖群友提供的设备。

给论坛用上了文本嵌入模型

依云's Blog ·

利用LLM嵌入进行文本数据的7个高级特征工程技巧

利用LLM嵌入进行文本数据的7个高级特征工程技巧

MachineLearningMastery.com ·

$Qwen3 Embedding 技术解析：多语言文本嵌入与重排序的新标杆$

Qwen3 Embedding 技术解析：多语言文本嵌入与重排序的新标杆

我爱自然语言处理 ·

如何利用文本嵌入构建索引

如何利用文本嵌入构建索引

DEV Community ·

康奈尔大学提出的无监督文本嵌入转换方法vec2vec，基于强柏拉图表示假说，能够在无配对数据的情况下实现文本模型间的转换。实验表明，vec2vec在多个数据集上表现优异，能够保留嵌入的语义和几何结构，但也存在数据安全风险。

无需数据配对，文本嵌入也能互通？康奈尔研究：所有模型殊途同归

量子位 ·

本研究提出了一种新方法，通过识别嵌入空间中的语义方向向量，将文本嵌入限制在安全区域，以应对扩散模型生成不安全内容和社会偏见的问题。该方法增强了模型对潜在不安全提示的鲁棒性，并在多个基准数据集上显著减少了NSFW内容和社会偏见。

Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions

BriefGPT - AI 论文速递 ·

本研究提出了现代GBERT系列德国编码器模型，旨在满足资源有限时对编码器模型的需求。该模型在自然语言理解、文本嵌入和长上下文推理任务上表现优异，推动了德国NLP生态系统的发展。

Modern GBERT: German Independent Encoder Model Trained from Scratch

BriefGPT - AI 论文速递 ·

随着Dify知识库的增长，传统的相似度计算已无法满足需求，重排序模型变得越来越受欢迎。本文介绍如何搭建HuggingFace的文本嵌入推理，并将其整合到Dify中，以改善检索结果的排序。使用Docker可以轻松部署，并通过重排序器提升检索性能。

自行架設Dify使用的重排序模型：Text Embeddings Inference / Self-Hosting a Dify Reranking Model: Text Embeddings Inference

布丁布丁吃什麼？ ·

个性化图像：自回归模型在新研究中与扩散模型相媲美

个性化图像：自回归模型在新研究中与扩散模型相媲美

DEV Community ·

文本嵌入的长度偏见及其在搜索中的影响

文本嵌入的长度偏见及其在搜索中的影响

Jina AI ·

汉斯-尤尔根·肖宁：pgai：将维基百科导入PostgreSQL

汉斯-尤尔根·肖宁：pgai：将维基百科导入PostgreSQL

Planet PostgreSQL ·

文本嵌入的示例应用

文本嵌入的示例应用

MachineLearningMastery.com ·

使用变换器生成文本嵌入

使用变换器生成文本嵌入

MachineLearningMastery.com ·