何恺明团队推出新论文MiniT2I,探索文生图生成。该模型基于MM-JiT架构,仅用258M参数,训练成本相当于一次标准ImageNet实验。MiniT2I通过直接在像素空间生成图像,简化了模型结构,去掉了VAE等复杂模块,显著降低计算开销。实验结果显示,MiniT2I在性能上超过多款大型模型,展现出强大竞争力。
完成下面两步后,将自动完成登录并继续当前操作。