小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

本文讨论了稀疏嵌入在电子商务搜索中的优势,特别是相较于BM25的29%提升。稀疏嵌入通过保留单个词汇的信号,解决了密集嵌入模糊匹配的问题,确保了精确匹配。SPLADE模型通过学习相关词汇扩展查询,提升了搜索结果的准确性。后续文章将详细介绍训练和评估过程。

电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

本文讨论了电子商务搜索中的稀疏嵌入微调,重点评估了SPLADE模型及其困难负样本挖掘。经过微调的SPLADE模型在nDCG@10指标上比BM25提高了28%,强调了领域特定训练的重要性。文章还分析了稀疏与密集向量的混合搜索效果,以及困难负样本挖掘(ANCE)对模型性能的提升。总体而言,微调显著改善了查询扩展、术语加权和电商词汇的表现。

电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第4部分:专业化与泛化

本文探讨了电子商务搜索中的稀疏嵌入微调,分析了专业化与泛化的权衡。研究表明,专注于特定领域的微调在单一零售商中效果最佳,而多领域训练则在多个零售商中更具泛化能力。微调模型能够更好地理解特定领域的搜索模式和词汇,从而提升搜索效果。

电子商务搜索中的稀疏嵌入微调 | 第4部分:专业化与泛化

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

本文讨论了在电子商务搜索中微调稀疏嵌入的方法,重点介绍了使用亚马逊ESCI数据集训练SPLADE模型的过程。强调了数据格式化的重要性,以及通过SpladeLoss实现对比学习与稀疏性正则化的平衡。此外,使用Modal的持久存储解决了检查点管理问题,确保了训练过程的稳定性。

电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

本文介绍了如何使用qdrant-sparse-finetune工具化稀疏嵌入微调,以改善电子商务搜索。该工具简化了数据处理、模型训练和评估流程,支持自动化操作,提升用户体验。最终,用户可将模型快速发布到HuggingFace,实现28%的性能提升。

电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z

小米MiMo团队推出HySparse混合稀疏注意力架构,显著降低KV Cache的存储和计算开销,提升超长上下文建模效率。通过将“选择”和“缓存”交给Full Attention层,HySparse实现了高效的长距离信息访问,实验结果显示其在多项任务中表现优异。

小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

量子位
量子位 · 2026-02-07T10:47:34Z
专为提升注意力计算,提供稀疏与密集核函数 | 开源日报 No.863

VidBee 是一款开源视频下载器,支持从 1000 多个网站下载视频和音频,界面简洁并具备自动订阅功能。FlashMLA 是高效的注意力核函数库,提升深度学习性能。UltraRAG 是低代码框架,简化检索增强生成流程。WeMD 是专为微信公众号创作者设计的 Markdown 编辑工具,支持多功能和跨平台使用。

专为提升注意力计算,提供稀疏与密集核函数 | 开源日报 No.863

开源服务指南
开源服务指南 · 2026-01-27T23:35:25Z

OpenAI开源的新模型采用Circuit Sparsity技术,使99.9%的权重为零,提升了模型的可解释性。通过严格的连接约束,简化了计算过程,解决了传统模型的黑箱问题。尽管计算成本较高,但未来有望实现更复杂的推理。

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

量子位
量子位 · 2025-12-14T06:27:09Z
Infinity - 一个为稠密向量、稀疏向量等提供混合搜索的AI原生数据库

Infinity是一个为LLM应用设计的AI原生数据库,支持混合搜索,包括稠密和稀疏嵌入、张量、全文及结构化字段。它提供低延迟、高吞吐量的检索,适用于RAG、搜索、推荐、问答和对话AI,并配有易用的Python SDK和单一二进制部署选项。

Infinity - 一个为稠密向量、稀疏向量等提供混合搜索的AI原生数据库

云原生
云原生 · 2025-11-24T11:30:55Z
一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略:将粗粒度的token压缩与细粒度的token选择相结合

DeepSeek R1引起关注,研究者提出新注意力机制NSA,旨在提高长上下文处理效率。NSA结合硬件优化与可训练设计,克服现有稀疏注意力方法的局限性,提升模型性能与训练效率。

一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略:将粗粒度的token压缩与细粒度的token选择相结合

结构之法 算法之道
结构之法 算法之道 · 2025-10-03T12:43:44Z

DeepSeek最新模型V3.2-Exp上线,采用新稀疏注意力机制DSA,提升长文本推理效率,并开源TileLang和CUDA算子,API价格降至五折,国庆礼包也令人惊喜。

DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪

量子位
量子位 · 2025-09-29T10:52:21Z
vLLM中的DeepSeek-V3.2-Exp:细粒度稀疏注意力的应用

DeepSeek-V3.2-Exp模型现已支持,采用稀疏注意力机制,适用于长文本任务。vLLM集成了新的CUDA内核,优化了性能,用户可通过特定指令进行部署和测试,未来将扩展对更多硬件的支持。

vLLM中的DeepSeek-V3.2-Exp:细粒度稀疏注意力的应用

vLLM Blog
vLLM Blog · 2025-09-29T00:00:00Z
PREAMBLE:通过块稀疏向量实现私密高效聚合

我们重新审视高维向量在双服务器系统中的安全聚合问题,提出了PREAMBLE机制。该机制通过块稀疏向量实现高效聚合,降低通信成本,并优化隐私与效用的平衡。与Prio相比,噪声方差的开销极小。

PREAMBLE:通过块稀疏向量实现私密高效聚合

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
屏蔽扩散:利用稀疏排斥生成新颖多样的图像

本文探讨了扩散模型生成图像的多样性问题,提出了一种通过引入数据驱动的排斥项来增强生成图像多样性和质量的方法。该方法在批量生成相同提示的图像时表现优异,同时保护特定图像集的多样性。

屏蔽扩散:利用稀疏排斥生成新颖多样的图像

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-11T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化

机器之心
机器之心 · 2025-06-30T03:45:43Z
NVIDIA 研究人员在 Transformer LLM 中引入动态内存稀疏化 (DMS),实现 8× KV 缓存压缩

动态内存稀疏化(DMS)是一种高效的键值缓存压缩方法,能够在不降低模型精度的情况下提升推理性能。研究表明,DMS在多个基准测试中表现优异,实现了8倍的KV缓存压缩,同时保持或提高了模型性能,适合资源受限环境。

NVIDIA 研究人员在 Transformer LLM 中引入动态内存稀疏化 (DMS),实现 8× KV 缓存压缩

实时互动网
实时互动网 · 2025-06-13T02:11:53Z

本研究解决了现有尖峰神经网络加速器未能充分利用二元激活独特分布模式的问题。提出的新框架“Phi”引入了两级稀疏性,以优化计算并显著减少运行时计算。实验结果表明,Phi在速度和能量效率上均显著优于现有尖峰神经网络加速器,具有重要的应用潜力。

Phi:利用基于模式的分层稀疏性实现高效尖峰神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究解决了稀疏和延迟奖励函数对强化学习应用造成的挑战,提出了一种新的注意力机制算法ARES,通过使用变压器的注意力机制生成塑造奖励,从而为任何环境创建稠密奖励函数。实验表明,ARES显著改善了延迟奖励场景中的学习,能够在数据量不足或低质量数据的情况下有效进行训练。

基于注意力的稀疏和延迟奖励塑造

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z
SMUGGLER:稀疏多单元粒度生成学习与容错性

本文介绍了SMUGGLER,一种新型神经网络架构,能够高效且容错地进行字节级文本生成。与传统的基于标记的语言模型不同,SMUGGLER直接处理32位字符块,采用稀疏投票、质数多通道纠错和对抗训练等机制。实验结果表明,SMUGGLER在生成莎士比亚文本时,所需参数显著少于传统方法,并能在普通硬件上实现高质量生成。

SMUGGLER:稀疏多单元粒度生成学习与容错性

DEV Community
DEV Community · 2025-05-13T20:14:05Z
miniCOIL:通往可用稀疏神经检索的道路

miniCOIL是一种轻量级的稀疏神经检索模型,旨在结合BM25的优点,克服传统稀疏检索的局限性。该模型通过语义理解提升检索精度,特别适用于文档搜索,测试结果显示其在多个领域略优于BM25,展现了稀疏神经检索的潜力。

miniCOIL:通往可用稀疏神经检索的道路

Qdrant - Vector Database
Qdrant - Vector Database · 2025-05-12T21:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码