小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
使用LLM嵌入和元数据构建上下文感知的Python搜索

本文介绍了如何使用Python构建上下文感知的语义搜索引擎,结合嵌入式相似性和结构化元数据过滤。内容涵盖句子嵌入和余弦相似度的原理,构建元数据感知的搜索索引,以及索引的持久化方法。这些技术能够有效找到与用户查询相关的文档,同时考虑上下文约束。

使用LLM嵌入和元数据构建上下文感知的Python搜索

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-22T12:00:56Z

本文介绍了如何使用vLLM进行离线推理,生成多模态嵌入,并展示了符合HuggingFace模型库规范的文本和图像提示格式。

【vLLM 学习】Vision Language Embedding

HyperAI超神经
HyperAI超神经 · 2026-03-18T09:00:03Z
电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

本文讨论了稀疏嵌入在电子商务搜索中的优势,特别是相较于BM25的29%提升。稀疏嵌入通过保留单个词汇的信号,解决了密集嵌入模糊匹配的问题,确保了精确匹配。SPLADE模型通过学习相关词汇扩展查询,提升了搜索结果的准确性。后续文章将详细介绍训练和评估过程。

电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
jina-embeddings-v5-text:新的小型多语言嵌入模型的最新状态

我们发布了第五代嵌入模型jina-embeddings-v5-text,提供677M和239M参数的两个版本,支持32K上下文和四种任务特定的LoRA适配器。v5-text-small在MMTEB上得分67.0,超越其他小于1B的模型,且体积更小。该模型在多语言和英语任务中表现优异,适合内存受限的部署。

jina-embeddings-v5-text:新的小型多语言嵌入模型的最新状态

Jina AI
Jina AI · 2026-02-19T11:33:59Z
适用于您的RAG管道的五大嵌入模型

在检索增强生成(RAG)管道中,嵌入模型是检索的基础。本文评估了多种英语和多语言嵌入模型,依据性能、下载量和实用性进行排名。前五名模型为BAAI bge-m3、Qwen3-Embedding-8B、Snowflake Arctic Embed L v2.0、Jina Embeddings V3和GTE Multilingual Base,适用于多种数据类型和领域的检索需求。

适用于您的RAG管道的五大嵌入模型

KDnuggets
KDnuggets · 2026-02-12T13:00:28Z
7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

本文介绍了七种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧,包括计算语义相似性、降维和去噪、使用聚类标签和距离、文本差异嵌入、嵌入白化、句子与词级嵌入聚合,以及将嵌入作为特征合成的输入。这些方法可以将通用嵌入转化为特定任务的高信号特征,从而提升模型性能。

7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-03T15:26:42Z
使用Vercel AI SDK构建支持代理

Vercel AI SDK是一个TypeScript工具包,用于构建AI功能,支持文本生成和嵌入。新课程教授如何创建自主决策的客户支持代理,利用支持文档和实时网络搜索回答问题,涵盖嵌入、检索和结构化输出等主题。

使用Vercel AI SDK构建支持代理

freeCodeCamp.org
freeCodeCamp.org · 2025-12-23T16:34:48Z
基于令牌计数的批处理:更快、更经济的查询嵌入推理

Voyage AI通过批处理技术提高嵌入模型的推理效率,采用去填充和基于令牌计数的策略,显著降低GPU推理延迟,提升吞吐量和资源利用率。实验表明,GPU推理延迟减少50%,在资源争用情况下,延迟更为稳定。

基于令牌计数的批处理:更快、更经济的查询嵌入推理

MongoDB
MongoDB · 2025-12-18T15:00:00Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊推出Nova多模态嵌入模型,支持文本、图像、视频和音频的统一嵌入,提升跨模态检索准确性,适用于语义搜索和生成增强检索,具备高效上下文处理能力和灵活输出维度选项。

Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-11-27T07:55:28Z

《Lost in Hyperspace》是一个中等难度的靶机挑战,利用PCA将高维数据降维到2D/3D,通过几何结构恢复字符顺序,最终提取出Flag:HTB{L0ST_1N_TH3_SP1R4L}。

HTB-Lost in Hyperspace:探索多维嵌入与隐写空间的旗帜追踪

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-11-10T03:40:54Z
GitHub推出新嵌入模型以提升代码搜索和上下文理解

GitHub为Copilot推出的新嵌入模型集成于Visual Studio Code中,提升了编程上下文理解和代码建议质量。该模型检索质量提高37.6%,速度加倍,内存使用减少八倍,C#和Java的代码建议接受率显著提升。新模型通过对比学习和多层次表示学习训练,能更好地区分有效和无效建议。GitHub计划持续优化模型,提升开发者体验。

GitHub推出新嵌入模型以提升代码搜索和上下文理解

InfoQ
InfoQ · 2025-10-10T10:27:00Z

Go语言的结构体嵌入特性存在读写不对称的问题。提案#9859旨在允许开发者在结构体字面值中直接引用嵌入字段,以简化初始化过程。该提案已进入活跃评审阶段,若通过,将提升Go开发者的体验。

Go 结构体初始化的“反直觉”设计终于要改了?深入探讨嵌入字段直接初始化提案

Tony Bai
Tony Bai · 2025-09-26T23:06:40Z
GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

GitHub推出了新的Copilot嵌入模型,提升了VS Code中的代码搜索速度和准确性,检索质量提高了37.6%。该模型优化了内存使用,支持更快的响应,帮助开发者更有效地找到相关代码片段。

GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

The GitHub Blog
The GitHub Blog · 2025-09-24T20:24:18Z
学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

企业AI需要特定技能与技术。我们在freeCodeCamp.org YouTube频道发布了一门课程,教授嵌入、RAG、多模态模型及Amazon Nova代理,涵盖AI工程、Amazon Tian文本嵌入和LangChain与Amazon Bedrock的集成,旨在构建端到端应用以提升客户服务效率。

学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

freeCodeCamp.org
freeCodeCamp.org · 2025-07-31T16:49:04Z
深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

本文介绍了如何利用BigQuery的机器学习能力,通过图像嵌入技术构建AI驱动的裙子搜索。图像嵌入将图像转化为高维数值表示,支持基于视觉相似性的搜索。用户可上传图片或文本描述,快速找到相似裙子,从而提升在线购物体验和销售效率。

深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

KDnuggets
KDnuggets · 2025-07-29T16:00:13Z
驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

多语言大模型中的跨语言表示对齐能提升跨语言任务性能。传统对齐方法需大量计算资源和数据,而模型干预是一种更高效的替代方案。我们分析了一种流行的干预方法(寻找专家),发现通过操控神经元可增强跨语言对齐,检索任务性能最高可提高2倍准确率。

驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-25T00:00:00Z
嵌入对象及其他索引问题

在最近的设计评审中,客户的应用因数据量增加导致性能下降,主要问题在于文档中嵌入对象的索引方式。尽管有110K可查询文档和15个索引,但索引占用85GB内存,超出4GB缓存,影响性能。建议采用复合索引和部分索引,以优化查询性能并减少索引大小。

嵌入对象及其他索引问题

MongoDB
MongoDB · 2025-07-16T14:58:00Z
Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

Google 的 Gemini Embedding 文本模型现已开放,支持100多种语言,具备灵活的维度选择,优化了速度和存储。该模型在多语言基准测试中表现优异,适用于语义搜索、分类和跨语言应用,未来将支持批处理和多模态嵌入。

Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

实时互动网
实时互动网 · 2025-07-16T02:48:50Z
如何选择嵌入模型

选择合适的嵌入模型对向量搜索至关重要。评估时需考虑语言支持、任务类型、序列长度、模型大小和优化支持等因素。构建真实数据集以评估模型性能,并权衡吞吐量、延迟和成本等运营因素。最终选择应基于具体需求,并可能随应用发展而调整。

如何选择嵌入模型

Qdrant - Vector Database
Qdrant - Vector Database · 2025-07-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码