ASVspoof 2021提出了深度伪造语音检测的新任务,展示了检测技术的进展与挑战。研究强调动态表示的重要性,并提出新方法以提高检测准确性。通过构建新数据集和引入频率掩蔽等技术,显著提升了模型的鲁棒性和泛化能力,为音频安全领域提供了重要的应用潜力。
本文介绍了一种新型动作条件视频预测模型,能够模拟物体运动并推广至新对象。研究使用了59,000个机器人交互数据集,实验结果表明该模型在视频预测方面优于现有方法。此外,提出了多种基于图神经网络和动态表示的技术,提升了机器人在动态场景中的操作能力和效率。
本文提出了一种基于风格条件的视频生成模型,其中引入了一种新颖的时态生成器,可以在不同的演员之间进行传递。通过时态 GAN 反演从一个内容或身份中提取和传递视频动作而无需进一步的预处理,如关键点。
完成下面两步后,将自动完成登录并继续当前操作。