小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

自监督学习使得在无需手动标注数据集的情况下训练神经网络成为可能。通过定义基于数据的预训练任务,自动生成标签并训练编码器以获取表示,这些表示可用于下游任务。常见的预训练任务包括图像补全、旋转预测和对比学习。模型性能评估方法包括线性评估、聚类和可视化。掩码自编码器(MAE)通过掩盖输入的部分补丁进行训练以重建图像,而对比表示学习则通过正负样本的评分函数优化编码器。

CS231n 讲义:自监督学习

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-05-02T00:45:09Z

本研究提出了一种自监督学习方法,针对手绘图像,通过特定的预处理任务和文本卷积网络的双分支架构,显著提升了手绘图像的特征表示能力。研究探讨了自监督学习框架及其在手写认证中的应用,提出了基于笔画部分遮罩的预训练任务,成功实现了作者识别等任务的最新成果。

基于去相关性的自监督视觉表征学习用于作者识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文研究了嵌入式检索模型的预训练任务对Transformer模型的影响,提出了多种高效的检索技术,显著提升了信息检索和图像检索的性能,并在基准测试中取得了优异成绩。

NUDGE:轻量级非参数化嵌入微调以实现检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z
Adam有了mini版:内存占用少一半,吞吐量提升50%

研究团队提出了一种新的优化器Adam-mini,通过减少学习率的数量来降低内存使用,并在预训练任务中取得了优秀的性能。Adam-mini在内存占用和吞吐量方面优于AdamW,对超参数不敏感。在监督式微调和强化学习任务中,Adam-mini表现更好。

Adam有了mini版:内存占用少一半,吞吐量提升50%

机器之心
机器之心 · 2024-07-08T07:44:31Z

本文探讨了自监督学习在音乐领域的应用,特别是对比学习在有限数据下的优越性能。研究回顾了多种预训练任务,分析了当前方法的局限性及未来发展方向,并提出了结合自监督与监督学习的框架。

研究自监督方法以实现标签高效学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本研究探讨大型语言模型(LLMs)在情境学习中的机制,发现其在任务识别和学习方面具有双重作用。研究表明,具有挑战性的训练数据能显著提升模型的学习能力,并提出了隐式情境学习(I2CL)范式,以增强模型在少样本任务中的表现和鲁棒性。此外,研究证实LLMs能够通过组合预训练任务来学习新任务,并探讨了数据生成视角下的技术统一性。

探究上下文学习的预训练动态:任务识别与任务学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文研究了Transformer模型在上下文学习中的应用,分析了样本复杂性、预训练任务多样性和上下文长度对上下文学习成功的影响。结果表明,随着预训练示例数量的增加,模型在低多样性下倾向于记忆训练任务,而在高多样性下能够实现真正的上下文学习。此外,提出了一种机制,使Transformer能够有效进行线性回归预测,并探讨了模型的贝叶斯最优性质及其在任务转移中的表现。

学习正确的潜在变量是否必然改善上下文中的学习?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文探讨了大型语言模型在逻辑等效代码选择任务中的表现,发现其效果不佳。为改善性能,提出了“下一个标记预测 +”的预训练任务,结果在逻辑等效代码选择和代码补全任务中显著提升。同时,研究显示大型语言模型在时间序列预测中表现出色,能够处理缺失数据并解释预测结果。

通过多令牌预测实现更好、更快的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-30T00:00:00Z

UC2是一种跨语言跨模态表示学习框架,通过机器翻译引入其他语言的图像标题,提出了两个新的预训练任务,实现了新的最先进状态。

ICU: 通过将任务分为图像字幕和语言理解来克服视觉和语言建模中的语言障碍

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z

该研究提出了一种基于笔画部分遮罩的预训练任务,用于从未标注的在线手写数据中提取信息丰富的表示。该方法适用于英语和汉语,并通过微调预训练模型实现了作者识别、性别分类和利手性分类等任务。该研究凸显了利用预训练模型的优点。

在线手写文本分类的自监督表示学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

本文提出了GCL-GE指标来衡量图对比学习GCL的一般化能力,并设计了InfoAdv GCL框架,具有增强的一般化能力,在预训练任务适配和下游任务的一般化能力之间取得平衡,并在基准测试中表现出最先进的性能。

图对比学习的可证明训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z

该论文介绍了使用预训练的语言模型LayoutLM提取商业文件信息的方法。通过引入新的预训练任务和后处理算法,模型可以更好地理解文档布局和数字值。实验结果表明,该方法显著提高了对支出收据、发票和采购订单的提取性能。

使用特定的预训练任务提高商业文件信息提取

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-11T00:00:00Z

UC2是一个跨语言跨模态表示学习框架,通过引入其他语言的图像标题扩充数据集,提出两个新的预训练任务,实现了新的最先进状态。在多语言图像文本检索和多语言视觉问答基准上表现优异。

双视图课程优化输运用于跨语言跨模态检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-11T00:00:00Z

本文介绍了一种高效的视觉-语言基础模型EVE,通过统一的预训练任务,在共享的Transformer网络中编码了视觉和语言,并利用稀疏的Mixture-of-Experts模块捕捉模态特定信息。EVE通过遮蔽信号建模实现了图像像素和文本标记的信号重构,从而实现了快速训练和更好的下游性能。

EVE: 基于掩码预测和模态感知的高效视觉 - 语言预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z

CommerceMM是一种多模态模型,具备多种理解商业主题的能力,并可应用于多种任务。它使用预训练方式,在图像-文本对上完成了5个预训练任务,并提出了名为Omni-Retrieval的方法,用于9个新的跨模态和跨配对检索任务。结果显示,在7个商业相关的下游任务中,该模型在细调后实现了最先进的性能。

OmniDataComposer:多模态数据融合与无限数据生成的统一数据结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码