对比学习在多领域应用的最新进展与研究 - 小红花·文摘 - 小红花技术领袖俱乐部

自监督学习使得在无需手动标注数据集的情况下训练神经网络成为可能。通过定义基于数据的预训练任务，自动生成标签并训练编码器以获取表示，这些表示可用于下游任务。常见的预训练任务包括图像补全、旋转预测和对比学习。模型性能评估方法包括线性评估、聚类和可视化。掩码自编码器（MAE）通过掩盖输入的部分补丁进行训练以重建图像，而对比表示学习则通过正负样本的评分函数优化编码器。

CS231n 讲义：自监督学习

Louis Aeilot's Blog ·

电子商务搜索中的稀疏嵌入微调 | 第二部分：在Modal上训练SPLADE

电子商务搜索中的稀疏嵌入微调 | 第二部分：在Modal上训练SPLADE

Qdrant - Vector Database ·

演讲：构建大规模现实应用的嵌入模型

演讲：构建大规模现实应用的嵌入模型

InfoQ ·

NeurIPS2025丨MIT提出自动化科学发现工具，AutoSciDACT对天文/物理/生物医学等异常数据强敏感

NeurIPS2025丨MIT提出自动化科学发现工具，AutoSciDACT对天文/物理/生物医学等异常数据强敏感

HyperAI超神经 ·

生成与对比图表示学习

生成与对比图表示学习

Apple Machine Learning Research ·

Jina代码嵌入：在0.5B和1.5B参数下的最先进代码检索

Jina代码嵌入：在0.5B和1.5B参数下的最先进代码检索

Jina AI ·

MH-Net是一种新型加密流量分类模型，通过构建多视角异构图，挖掘流量字节之间的细粒度关联。该模型结合多任务训练和对比学习，显著提高了流量分类的准确性，尤其在CIC-IoT和ISCX数据集上表现突出，验证了其有效性和先进性。

清华大学 | MH-Net：基于多视角异构图的加密流量分类方法

FreeBuf网络安全行业门户 ·

VLM2Vec-V2：用于跨图像、视频和视觉文档进行多模态嵌入学习的统一计算机视觉框架

VLM2Vec-V2：用于跨图像、视频和视觉文档进行多模态嵌入学习的统一计算机视觉框架

实时互动网 ·

跨平台 AI 能力扩展工具：精选 MCP 客户端集合 | 开源日报 No.672

跨平台 AI 能力扩展工具：精选 MCP 客户端集合 | 开源日报 No.672

开源服务指南 ·

本研究提出了一种新的任务调制对比学习方法（TMCL），旨在解决机器学习中的灾难性遗忘问题。该方法通过自上而下的调制，即使在仅有1%标签的情况下，也能显著提升分类增量和迁移学习效果，表明其在稳定性与可塑性之间的平衡中至关重要。

Contrastive Consolidation of Top-Down Modulations Achieves Sparsely Supervised Continual Learning

BriefGPT - AI 论文速递 ·

本研究探讨了语音对话中声音反馈（如“嗯”、“是的”、“好吧”）的感知韵律相似性。结果表明，光谱和自监督语音表征在编码韵律方面优于音高特征，尤其在同一说话者的反馈中，通过对比学习可进一步优化这些表征。

Representation of Perceived Prosodic Similarity of Conversational Feedback

BriefGPT - AI 论文速递 ·

本研究提出了一种音频视觉联合学习方法（MACB-DF），旨在解决多模态检测中的学习不平衡问题。该方法通过对比学习促进模态融合，实验结果表明在多个深度伪造数据集上达到了95.5%的准确率，并提升了跨数据集的泛化能力。

Multiscale Adaptive Conflict-Balancing Model for Multimedia Deepfake Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种原型增强框架，旨在解决联邦学习中因领域异质性导致的全局模型收敛问题。通过引入联邦增强原型对比学习（FedAPC），显著提升了模型的泛化能力和稳健性，实验结果表明其性能优于现有技术。

Robust Federated Learning for Heterogeneity in Edge Device Domains

BriefGPT - AI 论文速递 ·

本研究提出了一种名为WiMAE的无线掩蔽自编码器基础模型，专注于多天线无线信道数据集的自监督学习。通过结合对比学习与重构任务，开发的ContraWiMAE显著提升了模型的表示能力和数据效率，为无线信道表示学习奠定了基础。

基于对比和掩蔽自编码器学习的无线信道表示的多任务基础模型

BriefGPT - AI 论文速递 ·

Tangu Mod是Voyage AI的联合创始人，他在WE8播客中分享了企业AI和检索增强生成（RAG）的见解。他强调了在金融和法律等领域开发特定嵌入模型的重要性，并讨论了对比学习和数据增强在文本与图像嵌入中的应用。他指出，尽管合成数据生成成本高，真实数据的多样性更具优势，并提到AI的模块化发展使得使用AI变得更加简单。

马腾宇谈Voyage AI - Weaviate播客第91期！

Josherich的博客 ·

本研究提出了一种新的洛伦兹知识聚合机制及三种模型增强技术，解决了对比学习在用户-物品二部图和知识图中捕捉层次结构的不足，推荐效果提升达11.03%。

Model-Enhanced Hyperbolic Contrastive Learning for Knowledge-Aware Recommendation

BriefGPT - AI 论文速递 ·

本研究提出DFA-CON对比学习框架，旨在有效检测生成式AI工具对视觉艺术创作的版权侵犯与伪造问题。DFA-CON通过建立原创艺术作品与伪造作品之间的亲和力，展现出强大的检测性能，超越了现有预训练模型。

DFA-CON：一种用于检测深度伪造艺术版权侵犯的对比学习方法

BriefGPT - AI 论文速递 ·

本研究提出CSE-SFP方法，旨在提高无监督句子表示学习的效率。该方法通过一次前向传播实现有效的对比学习，显著提升嵌入质量，降低训练时间和内存消耗，对文本表示领域具有重要影响。

CSE-SFP: Enabling Unsupervised Sentence Representation Learning via a Single Forward Pass

BriefGPT - AI 论文速递 ·

本研究提出了SacFL框架，旨在解决终端设备在持续学习中面临的存储资源有限和任务转移检测能力不足的问题。通过编码器-解码器结构和对比学习机制，显著降低了存储需求，并实现了自主的数据转移检测。实验结果验证了该框架在资源受限设备上的有效性。

SacFL: Adaptive Federated Continual Learning for Resource-Constrained End Devices

BriefGPT - AI 论文速递 ·

本研究提出了OmicsCL模块化对比学习框架，旨在解决多组学数据中无监督学习疾病亚型的难题，挖掘与患者生存相关的临床集群，为个性化医疗提供新思路。

OmicsCL: Unsupervised Contrastive Learning for Cancer Subtype Discovery and Survival Stratification

BriefGPT - AI 论文速递 ·