本文探讨了扩散变换器(DiT)模型的归纳偏差对泛化能力的影响。研究发现,局部注意力窗口与泛化能力密切相关,通过限制注意力窗口并注入局部注意力,可以显著提高模型的泛化和生成质量,尤其在训练数据较少的情况下。优化DiT的归纳偏差有助于提升性能。
本研究改进了光流处理中的凸上采样方法,提出了解耦加权和上下文特征引入,开发了基于局部注意力的上采样器,实验结果表明这些改进提升了光流模型的精度。
本文提出了一种新颖的文本到纹理生成框架,利用深度图和文本提示生成高清晰、一致的三维纹理。该方法通过预训练的扩散模型和局部注意力机制,显著提升了纹理的一致性和视觉质量,克服了现有模型的局限性,适用于多种平台。
完成下面两步后,将自动完成登录并继续当前操作。