对话视频中剪辑的平滑化处理

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究提出了一种新的框架来平滑跳切,以说话人视频为背景。通过融合密集姿态关键点和面部标记的中级表示,插值关键点和标记,并使用图像转换网络合成像素,实现了比强视频插值基准更强的结果。实验表明,即使在说话人旋转或跳切中发生剧烈运动的情况下,也能实现无缝的过渡。

🎯

关键要点

  • 提出了一种新颖的框架来平滑跳切,以说话人视频为背景。
  • 融合密集姿态关键点和面部标记的中级表示,利用视频中其他源帧中的主体。
  • 在切点周围的最后帧之间插值关键点和标记以实现运动。
  • 使用基于关键点和源帧的图像转换网络合成像素。
  • 提出跨模态注意机制来选择每个关键点的最合适源选项。
  • 方法在各种说话人视频的跳切情况下表现优异,超越强视频插值基准。
  • 实验表明,即使在剧烈运动的情况下也能实现无缝过渡。
➡️

继续阅读