FreeMask:重新思考注意力掩码在零-shot视频编辑中的重要性

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

该研究提出了一种文本视频编辑方法,分为两个阶段:首先用文本到图像扩散模型编辑关键帧,然后用MaskINT模型进行帧插值。MaskINT利用非自回归生成变压器,有效指导中间帧结构。实验显示,该方法在效率和效果上优于其他模型,提供了实用的文本视频编辑解决方案。

原文中文,约300字,阅读约需1分钟。
阅读原文