小红花·文摘

本研究提出了ParaGAN框架，解决了生成对抗网络（GAN）训练中的效率低下和不稳定性问题。通过异步训练和不对称优化，ParaGAN将BigGAN的训练时间从15天缩短至14小时，并实现了91%的扩展效率，能够生成高分辨率图像。

BriefGPT - AI 论文速递 ·

本研究探讨了稀疏语言模型的高效训练方法，包括异步训练和专家模型培训。引入稀疏自编码器解决了估计偏差问题，实现了可解释特征的无监督发现。同时，提出自适应稀疏训练（AST），显著缩小稠密与稀疏模型的性能差距，推动特征的普遍性和可解释性发展。

BriefGPT - AI 论文速递 ·