本文提出了一种新的混合专家模型(EC-DIT),通过优化专家选择路由以适应不同文本图像的复杂度。EC-DIT可扩展至970亿参数,显著提升训练收敛性和生成质量,并在文本对齐评估中获得71.68%的最佳GenEval分数。
完成下面两步后,将自动完成登录并继续当前操作。