本研究提出了一种迭代去噪框架,解决了离散扩散模型在图形生成中的噪声累积问题。通过假设时间条件独立,简化了噪声处理,并引入算法改进,实证结果表明该方法优于现有基线。
本文提出了一种新的政策梯度算法——得分熵策略优化(SEPO),旨在解决离散扩散模型在使用人类反馈的强化学习中的微调难题。该方法在处理非可微分奖励时展现出良好的可扩展性和效率,可能推动相关研究的发展。
本研究提出了一种新颖的离散扩散模型蒸馏方法,解决了自回归大型语言模型在生成速率和延迟上的局限性。该方法能够同时生成至少32个令牌,显著提高文本质量和生成速度,超越传统自回归模型,具有广泛的应用潜力。
本文介绍了一种基于NOS和LaMBO-2的蛋白质设计方法,结合离散扩散模型和强化学习,优化抗体的表达率和亲和力。研究展示了生成模型在生物序列设计中的潜力,并提出了解决生成离散数据时引导问题的新框架和方法,实验结果在多个领域表现优异。
该论文提出了多种新颖的文本到图像生成方法,如分块并行解码、离散扩散模型和文本条件采样,显著提升了生成速度和图像质量,并验证了其在机器翻译和图像超分辨率任务中的有效性。
研究提出了一种布局校正器模块,解决离散扩散模型生成不和谐布局的问题。该模块通过识别并重新生成和谐布局,显著提升布局生成性能。文章介绍了多种布局生成模型,如PLay、DLT、LayoutDM等,展示了其在条件布局生成中的潜力和优越性。这些模型支持多种条件和用户交互,提高了布局设计的效率和灵活性。
本文介绍了一种基于离散扩散模型(D3PMs)生成多声部符号音乐的方法,强调其高质量和灵活性。该方法结合变分自编码器和扩散模型,能够生成特定作曲家风格的音乐,并实现情感控制。此外,研究展示了通过分层语言模型生成完整音乐作品的能力,提升了音乐生成的可控性和质量。
完成下面两步后,将自动完成登录并继续当前操作。