小红花·文摘

最新的文本到图像生成模型在一致性角色生成方面面临挑战。研究提出了一种自动化解决方案，通过文本提示生成连贯的角色图像，并在多个数据集上表现优异。此外，研究探讨了生成视频故事的复杂性，提出了新的基准StoryBench，以评估文本到视频模型的性能，推动该领域的研究进展。