在频域中使用移动平均采样提升扩散模型
该研究论文提出了一种名为 MASF 的新方法,通过在频域内对不同频率分量进行移动平均来解决扩散模型在图像生成中的去噪不稳定性问题,实验结果表明,MASF 相较于基准方法具有卓越的性能和可扩展性。
多视角祖先采样(MAS)是一种用于生成一致的多视角2D样本的方法,可以创建对应的3D物体。MAS利用2D数据训练的扩散模型,为3D数据稀缺的运动领域提供机会。MAS通过去噪不同角度下的多个2D运动序列,保证了每个扩散步骤中所有视角的一致性,并将生成结果合并为统一的3D序列。MAS在职业篮球动作、韵律体操和马障碍赛等视频中展示了效果。相比流行的基于优化的去噪方法,MAS提供了更自然的一体化,避免了常见问题。