对话视频中剪辑的平滑化处理
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究提出了一种新的框架来平滑跳切,以说话人视频为背景。通过融合密集姿态关键点和面部标记的中级表示,插值关键点和标记,并使用图像转换网络合成像素,实现了比强视频插值基准更强的结果。实验表明,即使在说话人旋转或跳切中发生剧烈运动的情况下,也能实现无缝的过渡。
🎯
关键要点
- 提出了一种新颖的框架来平滑跳切,以说话人视频为背景。
- 融合密集姿态关键点和面部标记的中级表示,利用视频中其他源帧中的主体。
- 在切点周围的最后帧之间插值关键点和标记以实现运动。
- 使用基于关键点和源帧的图像转换网络合成像素。
- 提出跨模态注意机制来选择每个关键点的最合适源选项。
- 方法在各种说话人视频的跳切情况下表现优异,超越强视频插值基准。
- 实验表明,即使在剧烈运动的情况下也能实现无缝过渡。
➡️