DiffSensei是一个结合多模态大语言模型与扩散模型的漫画生成框架,解决了多角色场景中的一致性和布局控制问题。它通过创新机制实现角色动态调整,支持灵活对话布局,并发布了包含4.3万页漫画的MangaZero数据集。实验结果表明,DiffSensei在角色一致性和图像质量上优于现有模型,推动了漫画创作和教育可视化的发展。
完成下面两步后,将自动完成登录并继续当前操作。