小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种逐步自适应混合训练框架SASR,旨在解决大型语言模型训练中的过拟合和模式崩溃问题。SASR通过动态调整监督微调与强化学习的比例,提升模型性能。

逐步自适应集成监督微调和强化学习用于任务特定的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种新型生成对抗网络(DPN-GAN),旨在解决音频合成中的分辨率限制和模式崩溃问题。通过引入周期性偏置的ReLU激活函数和可变形卷积模块,DPN-GAN显著提高了合成音频的质量和保真度。

DPN-GAN: Inducing Periodic Activations in Generative Adversarial Networks for High-Fidelity Audio Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本文提出了一种新型生成对抗网络CKGAN,基于特征核积分概率度量框架,旨在解决模式崩溃问题。CKGAN通过自动学习特征核函数,在合成和真实图像基准测试中表现优于其他GAN,接近手动调整的最佳性能。

CKGAN: Training Generative Adversarial Networks Using Characteristic Kernel Integral Probability Metrics

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本研究提出了“动态适应性插值蒸馏(TAID)”方法,旨在解决教师模型与学生模型之间的容量差异及模式崩溃问题。TAID通过动态插值教师和学生分布,有效防止模式崩溃,提升知识蒸馏效果。实验结果显示,该方法在不同模型规模和架构下均表现优越,推动了人工智能技术的可及性发展。

TAID:用于语言模型知识转移的动态适应性插值蒸馏方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-28T00:00:00Z

本研究提出了一种新颖的生成对抗网络(GAN)训练框架,旨在解决模式崩溃带来的不稳定性问题,提升训练效率并降低梯度估计方差,为生成公平的合成数据提供新思路。

Parallel Temperature Generative Adversarial Network

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究探讨了语言模型生成中的幻觉和模式崩溃问题,发现保持生成的一致性和广度在大多数情况下难以实现,但负示例可以改善这一情况。

The Limitations of Language Generation: Balancing Hallucination and Mode Collapse

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本文提出了一种新方法CFG++,将文本引导问题视为逆问题,利用扩散模型克服传统CFG的不足,显著提升文本到图像生成的质量和可逆性,减少模式崩溃,展现广泛应用潜力。

条件生成的修正扩散引导

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本研究提出了CPSample方法,解决了小型数据集上扩散模型训练的准确性问题,显著提高了模型在防御成员推断攻击方面的稳健性,并有效防止模式崩溃。

CPSample:保护分类器抽样以保护扩散过程中的训练数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文介绍了一种名为持久采样(PS)的序贯蒙特卡洛(SMC)方法的扩展,用于贝叶斯推理。PS通过允许来自先前迭代的粒子持续存在来减少计算成本,并生成一个随着迭代进行而不断增长的、加权的粒子集合。PS解决了粒子贫化和模式崩溃问题,提供了更准确的后验近似和较低方差的边际似然估计。此外,PS还提高了过渡核适应性,用于有效的探索。实验证明,PS在后验矩估计中具有较低的平方偏差,并且显著减少了边际似然误差,同时计算成本更低。

持续采样:发挥序贯蒙特卡罗的潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-30T00:00:00Z

该研究提出了一种使用Gromov-Monge嵌入的深度生成模型来解决GANs的挑战,通过识别数据的底层测度的低维结构并将其映射到参考测度,保持底层几何的一致性,从而确保更好的参数初始化和模式崩溃鲁棒性。实验证明了该方法在生成高质量图像、避免模式崩溃以及对不同的起始条件具有鲁棒性方面的有效性。

通过 Gromov-Monge 嵌入的单调生成建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码