本研究探讨了扩散变换器(DiT)的模型规模和数据需求,首次确认了DiT的规模定律,展示了预训练损失与计算量的幂律关系。这些定律帮助确定最优模型规模和数据需求,并预测文本到图像生成的损失,为评估模型性能和数据质量提供基准。
完成下面两步后,将自动完成登录并继续当前操作。