对话视频中剪辑的平滑化处理
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种新颖的框架来平滑跳切,以说话人视频为背景。我们利用视频中其他源帧中主体的出现来融合密集姿态关键点和面部标记的中级表示。为了实现运动,我们在切点周围的最后帧之间插值关键点和标记。然后,我们使用一个基于关键点和源帧的图像转换网络来合成像素。由于关键点可能存在错误,我们提出了一种跨模态注意机制来选择和选择每个关键点的最合适源选项。通过利用这种中级表示,我们的方法可以获得比强视频插值基...
该研究提出了一种新的框架来平滑跳切,以说话人视频为背景。通过融合密集姿态关键点和面部标记的中级表示,插值关键点和标记,并使用图像转换网络合成像素,实现了比强视频插值基准更强的结果。实验表明,即使在说话人旋转或跳切中发生剧烈运动的情况下,也能实现无缝的过渡。