小红花·文摘

MotionEditor是一种视频动作编辑的扩散模型，能够在编辑过程中保留原始背景和主角外貌。该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成，生成与指导文本匹配的视频。此外，研究提出了对象中心扩散技术，降低了计算成本，并引入运动导向技术，允许用户精确编辑图像中对象的布局和姿态。

BriefGPT - AI 论文速递 ·

该文介绍了一种可伸缩的无监督面向对象中心的3D场景表示学习方法，通过学习在局部对象坐标系统中视角不变的3D对象表示，从而推断和维护3D场景的对象中心表示。

BriefGPT - AI 论文速递 ·