本研究提出了MusicInfuser方法,旨在生成与指定音乐轨道同步的高质量舞蹈视频。该方法通过音乐-视频跨注意力机制,避免了对运动捕捉数据的依赖,实现灵活且高质量的音乐驱动视频生成。
本研究提出了一种用户友好的网页音乐轨道上传和排序工具,旨在解决专辑制作中的技术障碍。引入的变压器模型在排序性能上优于随机基线,但仍需改进以达到更高的叙述本质方法的效果。
完成下面两步后,将自动完成登录并继续当前操作。