小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了如何使用vLLM进行离线推理,生成多模态嵌入,并展示了符合HuggingFace模型库规范的文本和图像提示格式。

【vLLM 学习】Vision Language Embedding

HyperAI超神经
HyperAI超神经 · 2026-03-18T09:00:03Z
电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

本文讨论了稀疏嵌入在电子商务搜索中的优势,特别是相较于BM25的29%提升。稀疏嵌入通过保留单个词汇的信号,解决了密集嵌入模糊匹配的问题,确保了精确匹配。SPLADE模型通过学习相关词汇扩展查询,提升了搜索结果的准确性。后续文章将详细介绍训练和评估过程。

电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
jina-embeddings-v5-text:新的小型多语言嵌入模型的最新状态

我们发布了第五代嵌入模型jina-embeddings-v5-text,提供677M和239M参数的两个版本,支持32K上下文和四种任务特定的LoRA适配器。v5-text-small在MMTEB上得分67.0,超越其他小于1B的模型,且体积更小。该模型在多语言和英语任务中表现优异,适合内存受限的部署。

jina-embeddings-v5-text:新的小型多语言嵌入模型的最新状态

Jina AI
Jina AI · 2026-02-19T11:33:59Z
适用于您的RAG管道的五大嵌入模型

在检索增强生成(RAG)管道中,嵌入模型是检索的基础。本文评估了多种英语和多语言嵌入模型,依据性能、下载量和实用性进行排名。前五名模型为BAAI bge-m3、Qwen3-Embedding-8B、Snowflake Arctic Embed L v2.0、Jina Embeddings V3和GTE Multilingual Base,适用于多种数据类型和领域的检索需求。

适用于您的RAG管道的五大嵌入模型

KDnuggets
KDnuggets · 2026-02-12T13:00:28Z
7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

本文介绍了七种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧,包括计算语义相似性、降维和去噪、使用聚类标签和距离、文本差异嵌入、嵌入白化、句子与词级嵌入聚合,以及将嵌入作为特征合成的输入。这些方法可以将通用嵌入转化为特定任务的高信号特征,从而提升模型性能。

7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-03T15:26:42Z
使用Vercel AI SDK构建支持代理

Vercel AI SDK是一个TypeScript工具包,用于构建AI功能,支持文本生成和嵌入。新课程教授如何创建自主决策的客户支持代理,利用支持文档和实时网络搜索回答问题,涵盖嵌入、检索和结构化输出等主题。

使用Vercel AI SDK构建支持代理

freeCodeCamp.org
freeCodeCamp.org · 2025-12-23T16:34:48Z
基于令牌计数的批处理:更快、更经济的查询嵌入推理

Voyage AI通过批处理技术提高嵌入模型的推理效率,采用去填充和基于令牌计数的策略,显著降低GPU推理延迟,提升吞吐量和资源利用率。实验表明,GPU推理延迟减少50%,在资源争用情况下,延迟更为稳定。

基于令牌计数的批处理:更快、更经济的查询嵌入推理

MongoDB
MongoDB · 2025-12-18T15:00:00Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊推出Nova多模态嵌入模型,支持文本、图像、视频和音频的统一嵌入,提升跨模态检索准确性,适用于语义搜索和生成增强检索,具备高效上下文处理能力和灵活输出维度选项。

Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-11-27T07:55:28Z

《Lost in Hyperspace》是一个中等难度的靶机挑战,利用PCA将高维数据降维到2D/3D,通过几何结构恢复字符顺序,最终提取出Flag:HTB{L0ST_1N_TH3_SP1R4L}。

HTB-Lost in Hyperspace:探索多维嵌入与隐写空间的旗帜追踪

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-11-10T03:40:54Z
GitHub推出新嵌入模型以提升代码搜索和上下文理解

GitHub为Copilot推出的新嵌入模型集成于Visual Studio Code中,提升了编程上下文理解和代码建议质量。该模型检索质量提高37.6%,速度加倍,内存使用减少八倍,C#和Java的代码建议接受率显著提升。新模型通过对比学习和多层次表示学习训练,能更好地区分有效和无效建议。GitHub计划持续优化模型,提升开发者体验。

GitHub推出新嵌入模型以提升代码搜索和上下文理解

InfoQ
InfoQ · 2025-10-10T10:27:00Z

Go语言的结构体嵌入特性存在读写不对称的问题。提案#9859旨在允许开发者在结构体字面值中直接引用嵌入字段,以简化初始化过程。该提案已进入活跃评审阶段,若通过,将提升Go开发者的体验。

Go 结构体初始化的“反直觉”设计终于要改了?深入探讨嵌入字段直接初始化提案

Tony Bai
Tony Bai · 2025-09-26T23:06:40Z
GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

GitHub推出了新的Copilot嵌入模型,提升了VS Code中的代码搜索速度和准确性,检索质量提高了37.6%。该模型优化了内存使用,支持更快的响应,帮助开发者更有效地找到相关代码片段。

GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

The GitHub Blog
The GitHub Blog · 2025-09-24T20:24:18Z
学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

企业AI需要特定技能与技术。我们在freeCodeCamp.org YouTube频道发布了一门课程,教授嵌入、RAG、多模态模型及Amazon Nova代理,涵盖AI工程、Amazon Tian文本嵌入和LangChain与Amazon Bedrock的集成,旨在构建端到端应用以提升客户服务效率。

学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

freeCodeCamp.org
freeCodeCamp.org · 2025-07-31T16:49:04Z
深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

本文介绍了如何利用BigQuery的机器学习能力,通过图像嵌入技术构建AI驱动的裙子搜索。图像嵌入将图像转化为高维数值表示,支持基于视觉相似性的搜索。用户可上传图片或文本描述,快速找到相似裙子,从而提升在线购物体验和销售效率。

深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

KDnuggets
KDnuggets · 2025-07-29T16:00:13Z
驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

多语言大模型中的跨语言表示对齐能提升跨语言任务性能。传统对齐方法需大量计算资源和数据,而模型干预是一种更高效的替代方案。我们分析了一种流行的干预方法(寻找专家),发现通过操控神经元可增强跨语言对齐,检索任务性能最高可提高2倍准确率。

驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-25T00:00:00Z
嵌入对象及其他索引问题

在最近的设计评审中,客户的应用因数据量增加导致性能下降,主要问题在于文档中嵌入对象的索引方式。尽管有110K可查询文档和15个索引,但索引占用85GB内存,超出4GB缓存,影响性能。建议采用复合索引和部分索引,以优化查询性能并减少索引大小。

嵌入对象及其他索引问题

MongoDB
MongoDB · 2025-07-16T14:58:00Z
Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

Google 的 Gemini Embedding 文本模型现已开放,支持100多种语言,具备灵活的维度选择,优化了速度和存储。该模型在多语言基准测试中表现优异,适用于语义搜索、分类和跨语言应用,未来将支持批处理和多模态嵌入。

Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

实时互动网
实时互动网 · 2025-07-16T02:48:50Z
如何选择嵌入模型

选择合适的嵌入模型对向量搜索至关重要。评估时需考虑语言支持、任务类型、序列长度、模型大小和优化支持等因素。构建真实数据集以评估模型性能,并权衡吞吐量、延迟和成本等运营因素。最终选择应基于具体需求,并可能随应用发展而调整。

如何选择嵌入模型

Qdrant - Vector Database
Qdrant - Vector Database · 2025-07-15T00:00:00Z
介绍Qdrant云推理

Qdrant Cloud Inference推出,用户可通过单一API生成、存储和索引嵌入,简化工作流程并加速开发。支持多种模型,提供每月免费令牌,方便开发与生产。付费用户可轻松启用推理功能,提高AI应用开发效率。

介绍Qdrant云推理

Qdrant - Vector Database
Qdrant - Vector Database · 2025-07-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码