小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

本文讨论了在电子商务搜索中微调稀疏嵌入的方法,重点介绍了使用亚马逊ESCI数据集训练SPLADE模型的过程。强调了数据格式化的重要性,以及通过SpladeLoss实现对比学习与稀疏性正则化的平衡。此外,使用Modal的持久存储解决了检查点管理问题,确保了训练过程的稳定性。

电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
演讲:构建大规模现实应用的嵌入模型

嵌入模型通过将输入(如文本或图像)转换为向量,实现相似性检索和个性化推荐,广泛应用于搜索引擎和推荐系统。训练时采用对比学习,使相似输入的嵌入接近,不同输入的嵌入远离。模型评估关注检索效果,常用自动评分模型处理缺乏标准标签的情况。

演讲:构建大规模现实应用的嵌入模型

InfoQ
InfoQ · 2026-02-13T15:50:00Z
NeurIPS2025丨MIT提出自动化科学发现工具,AutoSciDACT对天文/物理/生物医学等异常数据强敏感

麻省理工学院等团队提出了AutoSciDACT方法,旨在自动化检测科学数据中的新发现。该方法结合对比学习和统计检验,能够有效识别异常信号,适用于天文学、物理学和生物医学等领域。研究表明,AutoSciDACT在不同数据集上表现优异,推动科学发现向数据驱动转型,提升科研效率。

NeurIPS2025丨MIT提出自动化科学发现工具,AutoSciDACT对天文/物理/生物医学等异常数据强敏感

HyperAI超神经
HyperAI超神经 · 2025-11-13T03:42:52Z
生成与对比图表示学习

本文介绍了一种新颖的自监督图表示学习架构,结合了对比学习和生成学习的优点。该框架通过社区感知的节点级和图级对比学习,生成更有效的节点对,并采用多种增强策略,提升了节点分类、聚类和链接预测等任务的性能。评估结果显示,该模型在多个任务上超越了现有最先进的方法。

生成与对比图表示学习

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
Jina代码嵌入:在0.5B和1.5B参数下的最先进代码检索

今天发布了jina-code-embeddings,包含0.5B和1.5B两种参数的代码嵌入模型,支持15种编程语言。0.5B模型在25个代码检索基准中平均表现为78.41%,1.5B为79.04%。这些模型通过对比学习和合成数据训练,展示了在小规模下的优异性能,验证了基础模型的重要性。

Jina代码嵌入:在0.5B和1.5B参数下的最先进代码检索

Jina AI
Jina AI · 2025-09-04T15:45:01Z

MH-Net是一种新型加密流量分类模型,通过构建多视角异构图,挖掘流量字节之间的细粒度关联。该模型结合多任务训练和对比学习,显著提高了流量分类的准确性,尤其在CIC-IoT和ISCX数据集上表现突出,验证了其有效性和先进性。

清华大学 | MH-Net:基于多视角异构图的加密流量分类方法

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-08-02T13:30:00Z
VLM2Vec-V2:用于跨图像、视频和视觉文档进行多模态嵌入学习的统一计算机视觉框架

VLM2Vec-V2是一种新型多模态嵌入模型,旨在统一图像、视频和视觉文档检索。基于MMEB-V2基准,支持多种输入模态,采用Qwen2-VL作为骨干,具备动态分辨率和多模态嵌入特性,提升了对比学习的稳定性。实验结果表明,该模型在多模态任务中表现优异。

VLM2Vec-V2:用于跨图像、视频和视觉文档进行多模态嵌入学习的统一计算机视觉框架

实时互动网
实时互动网 · 2025-07-28T02:56:16Z
跨平台 AI 能力扩展工具:精选 MCP 客户端集合 | 开源日报 No.672

awesome-mcp-clients 是一个支持多种上下文服务的 Model Context Protocol (MCP) 客户端集合,提升 AI 能力,包含跨平台应用、网页应用和浏览器扩展,提供多语言界面和实时聊天功能。rive-runtime 是 C++ 渲染器,支持艺术板加载和动画查询。smartcomponents 为 .NET 提供 AI 功能,促进开发。contrastors 是 Pytorch 的对比学习工具包,支持多 GPU 训练和 Huggingface 模型。

跨平台 AI 能力扩展工具:精选 MCP 客户端集合 | 开源日报 No.672

开源服务指南
开源服务指南 · 2025-07-21T07:35:31Z

本研究提出了一种新的任务调制对比学习方法(TMCL),旨在解决机器学习中的灾难性遗忘问题。该方法通过自上而下的调制,即使在仅有1%标签的情况下,也能显著提升分类增量和迁移学习效果,表明其在稳定性与可塑性之间的平衡中至关重要。

Contrastive Consolidation of Top-Down Modulations Achieves Sparsely Supervised Continual Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究探讨了语音对话中声音反馈(如“嗯”、“是的”、“好吧”)的感知韵律相似性。结果表明,光谱和自监督语音表征在编码韵律方面优于音高特征,尤其在同一说话者的反馈中,通过对比学习可进一步优化这些表征。

Representation of Perceived Prosodic Similarity of Conversational Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种音频视觉联合学习方法(MACB-DF),旨在解决多模态检测中的学习不平衡问题。该方法通过对比学习促进模态融合,实验结果表明在多个深度伪造数据集上达到了95.5%的准确率,并提升了跨数据集的泛化能力。

Multiscale Adaptive Conflict-Balancing Model for Multimedia Deepfake Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种原型增强框架,旨在解决联邦学习中因领域异质性导致的全局模型收敛问题。通过引入联邦增强原型对比学习(FedAPC),显著提升了模型的泛化能力和稳健性,实验结果表明其性能优于现有技术。

Robust Federated Learning for Heterogeneity in Edge Device Domains

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了一种名为WiMAE的无线掩蔽自编码器基础模型,专注于多天线无线信道数据集的自监督学习。通过结合对比学习与重构任务,开发的ContraWiMAE显著提升了模型的表示能力和数据效率,为无线信道表示学习奠定了基础。

基于对比和掩蔽自编码器学习的无线信道表示的多任务基础模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

Tangu Mod是Voyage AI的联合创始人,他在WE8播客中分享了企业AI和检索增强生成(RAG)的见解。他强调了在金融和法律等领域开发特定嵌入模型的重要性,并讨论了对比学习和数据增强在文本与图像嵌入中的应用。他指出,尽管合成数据生成成本高,真实数据的多样性更具优势,并提到AI的模块化发展使得使用AI变得更加简单。

马腾宇谈Voyage AI - Weaviate播客第91期!

Josherich的博客
Josherich的博客 · 2025-05-13T00:00:01Z

本研究提出DFA-CON对比学习框架,旨在有效检测生成式AI工具对视觉艺术创作的版权侵犯与伪造问题。DFA-CON通过建立原创艺术作品与伪造作品之间的亲和力,展现出强大的检测性能,超越了现有预训练模型。

DFA-CON:一种用于检测深度伪造艺术版权侵犯的对比学习方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种新的洛伦兹知识聚合机制及三种模型增强技术,解决了对比学习在用户-物品二部图和知识图中捕捉层次结构的不足,推荐效果提升达11.03%。

Model-Enhanced Hyperbolic Contrastive Learning for Knowledge-Aware Recommendation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出CSE-SFP方法,旨在提高无监督句子表示学习的效率。该方法通过一次前向传播实现有效的对比学习,显著提升嵌入质量,降低训练时间和内存消耗,对文本表示领域具有重要影响。

CSE-SFP: Enabling Unsupervised Sentence Representation Learning via a Single Forward Pass

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了SacFL框架,旨在解决终端设备在持续学习中面临的存储资源有限和任务转移检测能力不足的问题。通过编码器-解码器结构和对比学习机制,显著降低了存储需求,并实现了自主的数据转移检测。实验结果验证了该框架在资源受限设备上的有效性。

SacFL: Adaptive Federated Continual Learning for Resource-Constrained End Devices

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了OmicsCL模块化对比学习框架,旨在解决多组学数据中无监督学习疾病亚型的难题,挖掘与患者生存相关的临床集群,为个性化医疗提供新思路。

OmicsCL: Unsupervised Contrastive Learning for Cancer Subtype Discovery and Survival Stratification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z
大型语言模型在对称性测试中失败:新训练方法提升关系推理能力

研究表明,大型语言模型(LLMs)在理解对称和反对称关系方面表现不佳。为此,提出了一种新的对称感知训练方法,并基于Wikidata创建了数据集。结果显示,标准LLMs在该基准上的表现与随机猜测相当。通过对编码器进行对比学习重训练,模型在少量样本下实现了更好的知识保留和学习效率,验证了对称感知训练的有效性。

大型语言模型在对称性测试中失败:新训练方法提升关系推理能力

DEV Community
DEV Community · 2025-04-30T09:19:01Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码