该研究提出了一种文本视频编辑方法,分为两个阶段:首先用文本到图像扩散模型编辑关键帧,然后用MaskINT模型进行帧插值。MaskINT利用非自回归生成变压器,有效指导中间帧结构。实验显示,该方法在效率和效果上优于其他模型,提供了实用的文本视频编辑解决方案。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: