小红花·文摘

SeedLM：将大型语言模型权重压缩为伪随机生成器的种子

Apple Machine Learning Research ·

本文介绍了DiTFastAttn，一种加速扩散变换器（DiT）推理的后训练压缩方法。通过消除空间、时间和条件冗余，DiTFastAttn在图像和视频生成任务中显著提高了效率，计算量减少高达88%，实现了1.6倍的加速。此外，Delta-DiT框架在生成过程中进一步优化了性能，展示了Transformer在扩散模型中的应用潜力。

FORA：扩散变压器加速中的快速前向缓存

BriefGPT - AI 论文速递 ·