小红花·文摘

本研究提出了一种新型的可优化控制信号表示，解决了扩散模型在3D一致性、时间连贯性和运动准确性方面的不足，实验结果表明其在真实感和表现力上优于现有技术。

Learnable Gaussian Embedding for Controlling Virtual Human Generation

BriefGPT - AI 论文速递 ·

可灵视频生成可控性为什么这么好？快手又公开了四篇研究

机器之心 ·

该研究提出了一种基于循环神经网络的视频多目标分割模型，具备零样本学习和时间连贯性，推理速度快且表现优异。通过多模态对比监督和动态过滤器等方法，显著提升了视频对象分割性能，并在多个基准测试中超越现有技术。此外，研究还提出了Segment Anything Model 2，构建了大型分割数据集，提升了视频物体分割的精度。

第二届LSVOS挑战赛RVOS赛道的解决方案：空间-时间细化以实现一致的语义分割

BriefGPT - AI 论文速递 ·

本论文介绍了一种名为RBPGAN的视频超分辨率算法，旨在生成具有时间上连贯性和空间细节的解决方案。该算法通过集成两种先进模型，并使用不同数据集进行实验，证明在时间上具有一致的细节方面优于早期研究成果。

RBPGAN：视频超分辨率的循环反投影 GAN

BriefGPT - AI 论文速递 ·

本文提出了一种基于扩散的概率端到端模型，用于生成原始语音波形。该模型可以实现无限语音时长的合成，并保持高保真度和时间连贯性。相较于其他神经语音生成系统，该模型具有更高的合成质量。

DiffAR: 去噪扩散自回归模型用于原始语音波形生成

BriefGPT - AI 论文速递 ·

MagicEdit是一种简单但有效的视频编辑方法，通过学习内容、结构和动作信号，实现高保真度和时间连贯性的视频转换。与现有方法不同，MagicEdit避免了每帧质量下降，支持视频风格化、局部编辑、视频混合和视频外涂等各种编辑任务。

MagicEdit: 高保真和时间连贯的视频编辑

BriefGPT - AI 论文速递 ·