最新的文本到图像生成模型在一致性角色生成方面面临挑战。研究提出了一种自动化解决方案,通过文本提示生成连贯的角色图像,并在多个数据集上表现优异。此外,研究探讨了生成视频故事的复杂性,提出了新的基准StoryBench,以评估文本到视频模型的性能,推动该领域的研究进展。
完成下面两步后,将自动完成登录并继续当前操作。