小红花·文摘

本文提出了一种基于一致性约束的得分匹配方法，显著提升了CIFAR-10、AFHQ和FFHQ数据集的生成效果。研究利用潜在一致性模型解决高分辨率图像合成中的计算负担，提出了Stochastic Consistency Distillation方法，加快文本到图像生成过程，减少训练时间并提高生成图像质量，最终在多个数据集上实现了优于现有模型的效果。

稳定一致性调优：理解和改进一致性模型

BriefGPT - AI 论文速递 ·

本研究论文探索了将量子计算与生成对抗网络（GANs）融合的方法，通过融合量子数据表示方法，加速GAN的训练过程，提供新的视角。研究解决了与量子硬件限制、误差校正机制和可扩展性相关的问题。这是量子增强机器学习领域的关键一步，推动量子机器学习前沿的转变。

生成量子分类器的通用对抗扰动

BriefGPT - AI 论文速递 ·

本研究提出了一种简单但强大的方法来识别场景文本，使用全局特征引导注意力的二维卷积神经网络和序列解码器。该方法在训练时只使用单词级别的注释，能够获得较快的加速。在评估中，该方法在正常和不规则的场景文本上表现出最先进或竞争性的识别性能。

高频率促进适应（HiPA）是一种参数高效的方法，通过训练一步、低秩适配器来增强先进扩散模型中高频率能力的不足，使其能够在单一步骤中生成高质量图像。与渐进蒸馏相比，HiPA 在一步文本到图像生成中具有更好的性能（FID-5k 在 MS-COCO 2017 上从 37.3 降至 23.8），并具有 28.6 倍的训练加速（108.8 到 3.8 A100 GPU 天），仅需要 0.04％的训练参数（77.4 亿降至 330 万）。

HiPA: 通过高频率推广适应实现一步式文本到图像扩散模型

BriefGPT - AI 论文速递 ·

NVIDIA 助力训练亚马逊 Titan 基础模型

NVIDIA Blog ·

稳定一致性调优：理解和改进一致性模型

生成量子分类器的通用对抗扰动

IPAD：一种基于迭代、并行和扩散的场景文本识别网络

HiPA: 通过高频率推广适应实现一步式文本到图像扩散模型

NVIDIA 助力训练亚马逊 Titan 基础模型