PoM:使用多项式混合器的高效图像和视频生成
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种多项式混合器(PoM),旨在解决基于多头注意力的扩散模型在图像和视频生成中面临的高内存和计算需求问题,显著降低资源消耗,同时有效生成高质量样本。
🎯
关键要点
-
本研究提出了一种名为多项式混合器(PoM)的替代方案。
-
PoM旨在解决基于多头注意力的扩散模型在图像和视频生成中的高内存和计算需求问题。
-
PoM具有线性复杂性,能够显式编码整个序列。
-
该方案显著降低了资源消耗。
-
实验表明,PoM在生成高质量样本方面有效,同时降低了计算资源的需求。
🏷️