小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊推出Nova多模态嵌入模型,支持文本、图像、视频和音频的统一嵌入,提升跨模态检索准确性,适用于语义搜索和生成增强检索,具备高效上下文处理能力和灵活输出维度选项。

Amazon Nova Multimodal Embeddings:最先进的代理 RAG 和语义搜索嵌入模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-11-27T07:55:28Z
GitHub推出新嵌入模型以提升代码搜索和上下文理解

GitHub为Copilot推出的新嵌入模型集成于Visual Studio Code中,提升了编程上下文理解和代码建议质量。该模型检索质量提高37.6%,速度加倍,内存使用减少八倍,C#和Java的代码建议接受率显著提升。新模型通过对比学习和多层次表示学习训练,能更好地区分有效和无效建议。GitHub计划持续优化模型,提升开发者体验。

GitHub推出新嵌入模型以提升代码搜索和上下文理解

InfoQ
InfoQ · 2025-10-10T10:27:00Z
GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

GitHub推出了新的Copilot嵌入模型,提升了VS Code中的代码搜索速度和准确性,检索质量提高了37.6%。该模型优化了内存使用,支持更快的响应,帮助开发者更有效地找到相关代码片段。

GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

The GitHub Blog
The GitHub Blog · 2025-09-24T20:24:18Z
学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

企业AI需要特定技能与技术。我们在freeCodeCamp.org YouTube频道发布了一门课程,教授嵌入、RAG、多模态模型及Amazon Nova代理,涵盖AI工程、Amazon Tian文本嵌入和LangChain与Amazon Bedrock的集成,旨在构建端到端应用以提升客户服务效率。

学习企业AI – 使用Amazon Nova和Bedrock的嵌入、RAG和多模态代理

freeCodeCamp.org
freeCodeCamp.org · 2025-07-31T16:49:04Z
深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

本文介绍了如何利用BigQuery的机器学习能力,通过图像嵌入技术构建AI驱动的裙子搜索。图像嵌入将图像转化为高维数值表示,支持基于视觉相似性的搜索。用户可上传图片或文本描述,快速找到相似裙子,从而提升在线购物体验和销售效率。

深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

KDnuggets
KDnuggets · 2025-07-29T16:00:13Z
驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

多语言大模型中的跨语言表示对齐能提升跨语言任务性能。传统对齐方法需大量计算资源和数据,而模型干预是一种更高效的替代方案。我们分析了一种流行的干预方法(寻找专家),发现通过操控神经元可增强跨语言对齐,检索任务性能最高可提高2倍准确率。

驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-25T00:00:00Z
嵌入对象及其他索引问题

在最近的设计评审中,客户的应用因数据量增加导致性能下降,主要问题在于文档中嵌入对象的索引方式。尽管有110K可查询文档和15个索引,但索引占用85GB内存,超出4GB缓存,影响性能。建议采用复合索引和部分索引,以优化查询性能并减少索引大小。

嵌入对象及其他索引问题

MongoDB
MongoDB · 2025-07-16T14:58:00Z
Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

Google 的 Gemini Embedding 文本模型现已开放,支持100多种语言,具备灵活的维度选择,优化了速度和存储。该模型在多语言基准测试中表现优异,适用于语义搜索、分类和跨语言应用,未来将支持批处理和多模态嵌入。

Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

实时互动网
实时互动网 · 2025-07-16T02:48:50Z
如何选择嵌入模型

选择合适的嵌入模型对向量搜索至关重要。评估时需考虑语言支持、任务类型、序列长度、模型大小和优化支持等因素。构建真实数据集以评估模型性能,并权衡吞吐量、延迟和成本等运营因素。最终选择应基于具体需求,并可能随应用发展而调整。

如何选择嵌入模型

Qdrant - Vector Database
Qdrant - Vector Database · 2025-07-15T00:00:00Z
马特里俄什卡嵌入:与Voyage AI一起实现更智能的嵌入

嵌入模型是AI应用的基础,传统模型生成固定大小的向量,导致性能与计算开销之间的权衡。Matryoshka表示学习(MRL)提供灵活的多保真度嵌入,允许根据需求截取不同维度的向量,保持语义质量。MRL通过多损失训练优化信息分布,结合量化技术,提升了效率,适用于Voyage AI模型。

马特里俄什卡嵌入:与Voyage AI一起实现更智能的嵌入

MongoDB
MongoDB · 2025-07-14T16:00:00Z
Jina Embeddings v4:用于多模态多语言检索的通用嵌入

今天发布的jina-embeddings-v4是一个包含38亿参数的通用嵌入模型,支持文本和图像处理,特别在视觉内容检索方面表现优异,超越了主要竞争对手的闭源模型。该模型支持单向量和多向量嵌入,提升了检索性能。

Jina Embeddings v4:用于多模态多语言检索的通用嵌入

Jina AI
Jina AI · 2025-06-25T04:48:16Z
Qwen3 Embedding 技术解析:多语言文本嵌入与重排序的新标杆

阿里巴巴通义实验室发布的Qwen3 Embedding系列模型在文本嵌入和重排序任务上取得了突破,解决了多语言支持和专业领域表现不足的问题。该模型通过多阶段训练流程,结合弱监督预训练和高质量数据微调,显著提升了性能,尤其在代码检索和多语言任务中表现优于其他模型。

Qwen3 Embedding 技术解析:多语言文本嵌入与重排序的新标杆

我爱自然语言处理
我爱自然语言处理 · 2025-06-06T02:08:33Z

该研究解决了深度视觉模型因数据集中的虚假关联而学习到的偏见识别问题。CUBIC方法通过自动发现可能影响分类器行为的可解释概念,提升了偏见识别的有效性,且无需依赖具体的偏见候选或模型失败案例。实验表明,CUBIC能够在没有先验知识的情况下有效识别出以往未知的偏见。

CUBIC:利用视觉语言模型进行无监督偏见识别的概念嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究提出了一种基于图的新方法,通过Wi-Fi指纹轨迹实现复杂多层环境中的垂直定位。利用Node2Vec生成低维嵌入,并结合K-means聚类识别楼层,准确率达到68.97%。该方法为室内定位研究奠定了基础。

基于图的楼层分离:利用节点嵌入和WiFi轨迹聚类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z
模型汤的嵌入配方

在困难时期,一碗热汤最为舒适。意大利的米内斯特罗汤结合了豆类、蔬菜和米或面食,类似于神经网络的“模型汤”方法。该方法通过训练多个模型并合并结果,提高性能和鲁棒性。尽管训练成本不变,但能获得更好的结果。实验表明,合并不同训练检查点或任务特定模型可以提升整体性能,尽管有时会影响特定任务的表现。

模型汤的嵌入配方

Jina AI
Jina AI · 2025-05-07T16:43:10Z

本研究解决了在大规模存储检索增强生成(RAG)系统的高维向量嵌入时所面临的内存挑战。论文提出了一种新颖的方法,将浮点数8格式的量化与主成分分析(PCA)相结合,实现了8倍存储压缩,且性能影响小于使用int8量化。该成果有助于优化RAG系统的存储和性能,为实际应用提供了有效的性能-存储权衡可视化方法。

通过量化和降维技术优化检索增强生成系统的嵌入存储

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究解决了在药物发现和化学工程领域对具有特定性质分子的需求增长所带来的挑战。提出了一种结合变换器和修改后的生成对抗网络的新方法,通过综合摩根指纹和分子全局属性的嵌入生成器,实现了对分子的高精度生成。研究表明,该方法能够生成特定的气味分子,显示了其在分子设计领域的广泛应用潜力。

通过特征驱动的综合嵌入和生成对抗网络选择性改善分子生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-26T00:00:00Z

本研究针对自动驾驶的泛化能力不足问题,提出通过图形表示和多维缩放技术构建特征空间,以简化学习过程并提升车辆在复杂环境中的导航能力。

使用多维缩放学习道路网络的等距嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z

本研究提出OmegAMP框架,旨在解决深度学习在抗菌肽发现中的低命中率和可控性差的问题,通过生成模型和低维嵌入技术,提高抗菌药物抗性研究的效率。

通过控 Diffusion 生成靶向抗菌肽的高效嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码