小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了一种新的离散扩散概率模型DARL,基于Transformer架构进行图像生成,提升了全局一致性和多样性。研究表明,去噪补丁解码器和特定噪声时间表能改善生成效果。此外,AutoNAT方法显著提升了非自回归变压器的性能。DnD-Transformer模型解决了信息损失问题,展示了在图像生成中的潜力。DART模型结合自回归与扩散模型,提高了图像合成效率。

HART:高效的混合自回归变换器视觉生成模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本文介绍了一种新的离散扩散概率模型,利用无约束的Transformer架构实现向量量化标记的并行预测,从而提升图像生成的质量和多样性。研究中提出了Token-Critic辅助模型和正则化的向量量化框架,显著改善了生成效果。此外,SEED和MAGVIT-v2等新技术展示了大型语言模型在图像和视频生成中的优势,并提出了TiTok和Open-MAGVIT2等新方法,优化了图像生成过程,推动了该领域的创新。

图像文件夹:折叠标记的自回归图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文介绍了非自回归模型在图像生成中的优势,包括高效生成和低推理延迟。提出了一种新的离散扩散概率模型,利用无约束的Transformer架构实现并行预测,提升图像生成的多样性和一致性。同时,研究了基于矢量量化的文本到图像生成方法,显著改善了复杂场景图像的生成质量。

无向量量化的自回归图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码