小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
超越真实数据:从正则化的视角看合成数据

合成数据在真实数据稀缺时可提升模型的泛化能力,但过度依赖可能导致性能下降。本文提出一个学习理论框架,量化合成数据与真实数据之间的权衡,利用算法稳定性推导泛化误差界限,以确定最优的合成与真实数据比例。通过对混合数据的核岭回归分析,发现合成数据比例与测试误差呈U型关系,并在CIFAR-10和临床脑MRI数据集上进行了验证。理论扩展至领域适应,表明合理混合合成目标数据与有限源数据可减轻领域偏移,增强泛化能力。

超越真实数据:从正则化的视角看合成数据

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-30T00:00:00Z

本研究提出了一种结合领域适应算法与GAN和扩散模型的方法,旨在解决城市森林树木检测中低分辨率图像分析的挑战。该方法在增强航空图像质量的同时保持语义内容,实现了有效的树木分割,实验结果显示IoU指标提升超过50%。

Data Augmentation and Resolution Enhancement for Tree Segmentation Using GANs and Diffusion Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

该研究提出了TransPL方法,通过代码转移矩阵和贝叶斯法则改进无监督时间序列数据的领域适应,显著提高了准确率和F1分数。

TransPL:用于时间序列伪标注的VQ代码转移矩阵无监督领域适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z
大型语言模型数据短缺?MetaSynth的AI代理生成多样化训练数据

MetaSynth通过多专家LLM代理生成多样化合成数据,有效解决语言模型的数据短缺问题,显著提升领域适应能力,同时保持模型整体性能。

大型语言模型数据短缺?MetaSynth的AI代理生成多样化训练数据

DEV Community
DEV Community · 2025-04-21T20:07:46Z
可扩展在线双层优化的自适应训练分布

本文探讨了一种新的无监督领域适应过程,利用任务特定的决策边界和Wasserstein度量来缩小领域差距,从而有效地将知识从一个领域转移到另一个领域,无需新领域数据的标签或注释。

可扩展在线双层优化的自适应训练分布

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-04T00:00:00Z

本研究探讨了在真实场景中实现多模态领域适应与泛化的挑战,尤其是在面对未知目标分布时。提出利用大型预训练的多模态基础模型来提升适应与泛化性能,并总结了相关方法与未来研究方向。尽管已有进展,仍面临许多开放性挑战。

Advances in Multimodal Adaptation and Generalization: From Traditional Methods to Foundation Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

LeapVAD方法通过认知感知和双重思维,提升了自动驾驶在复杂场景下的推理能力,优化了环境表现和决策过程。实验结果显示,该方法在有限训练数据下优于传统摄像头方法,具备卓越的持续学习和领域适应能力。

LeapVAD: A Leap in Autonomous Driving through Cognitive Perception and Dual-Process Thinking

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了一种关注不平衡的领域适应框架(IADA),旨在解决医学影像中的领域偏移和类不平衡问题。通过自适应特征学习和领域对齐,显著提高了胚胎发育评估的准确性,实验结果显示准确率提高了25.19%。

Addressing Domain Shift in Embryo Development Assessment via Imbalance-Aware Domain Adaptation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一个针对领域适应中选择方法的框架,区分五种场景并提供相应建议。评估结果表明该框架有效,为研究人员和从业者提供指导。

A Problem-Oriented Framework for Domain Adaptation in Machine Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-08T00:00:00Z

本研究探讨了神经机器翻译模型在领域适应中遭遇的灾难性遗忘问题,分析了遗忘的原因及其与适应数据的关系,发现遗忘量与目标词汇覆盖率相关,为NMT领域适应的改进提供了新思路。

Machine Translation for Domain Adaptation: Content and Causes of Catastrophic Forgetting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出了一种音译零-shot领域适应(ZSDA)方法,以解决自动语音识别模型在未覆盖领域的性能下降问题。实验结果表明,该方法相比传统模型,词错误率降低了9.2%,显示了音译技术的优势。

Transliterated Zero-Shot Domain Adaptation for Automatic Speech Recognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-15T00:00:00Z

本文提出了四个关键贡献,解决视觉学习中的公平性和鲁棒性问题,包括新的公平性领域适应方法、开放世界公平持续学习框架,以及创新的几何和转换模型方法,显著提升特征表示的鲁棒性。

面向开放世界环境的鲁棒与公平视觉学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新颖的领域适应方法,旨在解决医院间因染色和数字化协议差异导致的组织病理影像转移问题。该方法通过监督对比学习提高类间可分离性,实验结果显示其在皮肤癌亚型分类中优于传统方法。

Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本文探讨了情境化词嵌入(CWE)在科学史、哲学和社会学研究中的应用,评估了五种基于BERT的模型,结果表明领域适应模型在消歧义和生成高质量意义聚类方面优于通用模型,强调了领域特定预训练的重要性,为科学话语的社会历史动态研究提供了新方法。

普朗克尺度上的意义?用于科学史、哲学和社会学研究的情境化词嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究提出了一种新的图学习视角(AGLP),解决了现有半监督领域适应方法忽视数据结构信息的问题。AGLP通过图卷积网络在实例图上学习,有效降低领域间差异,实验结果表明其优于现有方法。

AGLP: A Graph Learning Perspective for Semi-supervised Domain Adaptation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本文提出了回忆与精炼(RRDA)框架,以解决无源开放集领域适应中的新类问题,增强模型对未知类的识别能力。实验结果表明,RRDA在多个数据集上显著优于现有方法。

Recall and Refinement: A Simple and Effective Framework for Source-Free Open Set Domain Adaptation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究解决了资产信息与数据分类系统对接的难题,提出了一种基准评估方法,比较了文本嵌入模型的有效性,并强调了领域适应技术的进一步研究需求,同时发布了开源评估资源。

基于预训练文本嵌入模型对构建资产信息的对齐基准评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究针对多源无监督领域适应中的源域选择复杂性问题,提出了渐进微调框架和三种轻量级图路由策略,从而提高了自然语言推断和情感分析任务的准确率。

基于图路由的多源无监督领域适应的渐进微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本研究探讨领域适应在检索增强生成(RAG)模型中的应用,旨在提升其在特定领域(如客户服务)中的表现并减少幻觉现象。通过构建新数据集HotelConvQA,结果显示领域适应显著提高了问答任务的效果,并减少了幻觉的发生。

利用检索增强生成模型的领域适应技术用于问答并减少幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本研究提出了一种新的时间频率领域适应方法(TFDA),通过结合时间和频率特征,克服了现有方法的局限性,显著提升了预测准确性,尤其在应对领域转移的不确定性方面表现突出。

Synergistic Time and Frequency Domain Adaptation for Unsupervised Time Series

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码