小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语音增强中的自监督学习:从无配对训练到基础模型先验

语音增强(SE)面临数据、目标和任务等挑战,自监督学习(SSL)逐渐成为解决方案。SSL通过未配对数据学习和生成式方法,重塑了SE的训练目标。研究表明,SSL特征在增强任务中有效,未来将关注多任务统一增强、低信噪比生成模型及可控的语音生成。整体来看,SSL为SE提供了更强的先验和设计空间。

语音增强中的自监督学习:从无配对训练到基础模型先验

实时互动网
实时互动网 · 2026-06-03T06:35:16Z

自监督学习使得在无需手动标注数据集的情况下训练神经网络成为可能。通过定义基于数据的预训练任务,自动生成标签并训练编码器以获取表示,这些表示可用于下游任务。常见的预训练任务包括图像补全、旋转预测和对比学习。模型性能评估方法包括线性评估、聚类和可视化。掩码自编码器(MAE)通过掩盖输入的部分补丁进行训练以重建图像,而对比表示学习则通过正负样本的评分函数优化编码器。

CS231n 讲义:自监督学习

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-05-02T00:45:09Z
ICASSP 2026|迈向构建低资源语种的多任务语音理解模型

本文提出了一种针对低资源语言(如泰语)的语音大语言模型(SLLM)多任务理解方案,核心创新包括自监督学习的语音编码器XLSR-Thai、通用语音-文本对齐方法U-Align,以及泰语口语理解数据生成流水线Thai-SUP。实验结果表明,该方案有效提升了泰语的自动语音识别和多任务理解能力,为低资源语言的SLLMs构建提供了新路径。

ICASSP 2026|迈向构建低资源语种的多任务语音理解模型

实时互动网
实时互动网 · 2026-03-19T03:07:54Z
突破传统:ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

研究团队提出了一种新型神经元模型ReSU,克服了传统深度学习的局限。ReSU通过自监督学习和时间动态性,模拟生物神经元特性,展现出更高的能效和更好的泛化能力,为AI发展提供新方向,并有助于理解生物系统的工作原理。

突破传统:ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

Micropaper
Micropaper · 2026-03-02T01:00:00Z
PART如何组装成整体:学习图像的相对组成

本文介绍了一种名为PART的自监督学习方法,旨在通过连续相对变换克服传统网格结构在物体组成学习中的局限性。PART能够适应部分可见性和风格变化,在物体检测和时间序列预测等任务中表现优于基于网格的方法,具有在医学成像、视频和音频等领域的潜力。

PART如何组装成整体:学习图像的相对组成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-06T00:00:00Z
基于高斯过程的自监督学习

自监督学习(SSL)是一种无标签样本的机器学习方法。本文提出高斯过程自监督学习(GPSSL),通过高斯过程模型改进表示学习,克服传统SSL在生成相似观察对和不确定性量化方面的局限。GPSSL引入高斯先验,优化表示空间,实验结果显示其在分类和回归任务中优于传统方法,提高了准确性和不确定性控制。

基于高斯过程的自监督学习

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-30T00:00:00Z
10种在表格机器学习任务中使用嵌入的方法

嵌入表示是处理非结构化数据的有效工具,广泛应用于机器学习。本文介绍了十种利用嵌入的策略,如编码分类特征、聚合文本嵌入、聚类和自监督学习等,旨在提高数据利用效率和模型性能。

10种在表格机器学习任务中使用嵌入的方法

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-12T11:00:31Z

NeurIPS 2025最佳论文和时间检验奖揭晓,阿里Qwen门控注意力获最佳论文,何恺明的Faster R-CNN获时间检验奖。今年共七篇论文,涉及扩散模型和自监督学习等领域的突破。

NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文,何恺明Faster R-CNN获时间检验奖

量子位
量子位 · 2025-11-27T03:15:03Z
使用成对相对位移预训练学习脑电图信号的相对组成

本文介绍了一种新的自监督学习方法——成对相对位移预训练(PARS),用于从未标记的脑电图(EEG)信号中学习表示。PARS通过预测随机采样的EEG窗口对之间的相对时间位移,捕捉神经信号中的长程依赖性。研究表明,PARS预训练的变换器在标签效率和迁移学习方面优于现有方法,为EEG表示学习建立了新范式。

使用成对相对位移预训练学习脑电图信号的相对组成

Apple Machine Learning Research
Apple Machine Learning Research · 2025-11-20T00:00:00Z
理解类人智能的细微差别

菲利普·伊索拉研究人类智能与机器智能的关系,专注于计算机视觉和机器学习。他认为理解AI的智能机制有助于安全有效地将其融入社会,研究内容包括自监督学习和表示学习,旨在揭示人类与机器智能的共同点。

理解类人智能的细微差别

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-11-11T05:00:00Z
轻量化 JavaScript 行为框架:简化 HTML 交互过程 | 开源日报 No.743

Skip 是一款用于简化 iOS 和 Android 应用开发的转译器,支持多模块管理,并与 Xcode 和 Android Studio 集成。Efficient-Computing 提供高效计算方法,支持模型压缩和自监督学习。nodejieba 是高效的中文分词库,支持多种算法。

轻量化 JavaScript 行为框架:简化 HTML 交互过程 | 开源日报 No.743

开源服务指南
开源服务指南 · 2025-09-29T07:35:34Z
生成与对比图表示学习

本文介绍了一种新颖的自监督图表示学习架构,结合了对比学习和生成学习的优点。该框架通过社区感知的节点级和图级对比学习,生成更有效的节点对,并采用多种增强策略,提升了节点分类、聚类和链接预测等任务的性能。评估结果显示,该模型在多个任务上超越了现有最先进的方法。

生成与对比图表示学习

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
构建类似于Llama-2和Llama-3的仅解码器变换器模型

本文介绍了如何构建一个仅解码器的变换器模型,类似于Meta的Llama-2和Llama-3。该模型专注于文本生成,通过自监督学习进行训练,使用古腾堡项目的小说作为数据集,最终能够根据输入提示生成连贯的文本。

构建类似于Llama-2和Llama-3的仅解码器变换器模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-04T16:02:37Z
Nubank如何利用AI模型分析1亿用户的交易数据

Nubank利用基础模型处理大量金融数据,通过自监督学习自动提取用户行为特征,从而提升信用评分、个性化推荐和欺诈检测的预测性能。该系统整合了交易数据和结构化特征,优化了模型的开发与应用效率。

Nubank如何利用AI模型分析1亿用户的交易数据

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-07-22T15:30:44Z

硅智能的发展历程包括自监督学习和强化学习的演变。自2013年起,深度学习模型在图像识别等领域超越人类,开启了深度学习革命。2015年,ResNet和Adam优化方法的提出提升了模型训练效率。强化学习在2015年崭露头角,AlphaGo等模型展示了其潜力。未来,AI将通过更高效的数据学习和探索能力推动科学与技术进步。

推动硅智能的前沿:过去、开放问题与未来

Josherich的博客
Josherich的博客 · 2025-06-29T00:00:01Z

Meta发布的V-JEPA 2世界模型能够在62小时内训练机器人,使其理解物理世界并进行预测与规划。该模型通过自监督学习,利用大量视频数据提升机器人控制能力,标志着机器人技术的新纪元。

LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

量子位
量子位 · 2025-06-12T08:48:48Z

研究显示,当前天然小分子化学空间的探索不足10%,且90%的质谱图因缺乏注释而无法利用。捷克科学院团队开发的DreaMS模型通过自监督学习从7亿条质谱数据中提取分子特征,显著提高了质谱注释的准确性,为新药发现和疾病诊断提供了重要资源。

覆盖2亿分子质谱图,捷克科学院发布DreaMS模型,构建全球最大规模质谱数据集GeMS

HyperAI超神经
HyperAI超神经 · 2025-06-05T04:08:27Z

本研究提出符号图排序器(SGR),旨在提升大语言模型(LLMs)在会话搜索中的表现。通过将会话图转化为文本,增强了对图结构的理解,并通过自监督学习提升拓扑信息的捕捉能力。实验结果表明,该方法在基准数据集上表现优越,促进了传统搜索策略与现代LLMs的融合。

Unifying Graph Learning with Text: Unleashing the Potential of Large Language Models in Session Search

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种新的图神经网络基准测试方法,通过最大化重叠边进行自监督学习,解决图对齐问题。实验结果表明,该方法在分子回归任务中优于传统卷积架构。

基于图对齐的图神经网络及位置编码的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种大型无线定位模型(LWLM),旨在解决现有定位模型的数据依赖性和场景泛化能力不足的问题。LWLM通过自监督学习框架,在多种定位任务中显著提高了定位精度,推动了6G应用的发展,如自动驾驶和智慧制造。

Large Wireless Localization Model (LWLM): A Foundation Model for Positioning in 6G Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码