本文介绍了动态场景管理器(Dysen)模块,提升文本到视频生成(T2V)的质量。研究评估了现有评估指标的局限性,提出了新的评估方法T2VScore,并创建了TVGE数据集。同时,介绍了T2VHE协议和FETV基准,以优化评估过程。最后,提出了Text-Animator方法,改善视觉文本生成的稳定性,推动开源视频生成模型的发展。
完成下面两步后,将自动完成登录并继续当前操作。