机器之心 ·

贾佳亚团队联合Adobe提出GenProp，物体追踪移除特效样样在行

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。贾佳亚团队与Adobe合作开发的GenProp模型，实现视频中的物体移除、插入、替换及背景修改，展示生成模型的优势，推动视觉任务的革新。

🎯

🔎

GenProp模型通过生成式预训练，能够有效处理传统方法难以解决的视觉任务，如物体的影子和反射等side effects。这种能力使得GenProp在物体追踪和编辑方面展现出独特的优势，推动了视频编辑技术的进步。

GenProp的多种编辑能力，如物体替换和背景修改，虽然为视频创作带来了便利，但也可能引发对内容真实性的担忧。用户在使用时需谨慎，确保编辑内容不误导观众，维护信息的真实性和完整性。

GenProp的成功依赖于选择性内容编码器和掩码预测解码器的有效结合，这一框架在训练过程中需要大量合成数据。尽管如此，模型在处理复杂场景时仍可能面临数据不足和生成质量不稳定的挑战。

❓

GenProp模型能够完成物体移除、插入、替换及背景修改等任务。

GenProp可以同时移除物体及其产生的side effects，如反射和影子。

GenProp能够大幅改变替换物体的形状，超越传统视频编辑方法的限制。

GenProp通过选择性内容编码器和掩码预测解码器实现视频编辑，允许用户在初始帧上做任意修改。

GenProp能够生成物体与新背景的相互作用，适应协调背景替换。

训练过程中使用了Copy-and-Paste、Mask-and-Fill和Color Fill等数据制造技术。

🏷️