小红花·文摘

HyperAI超神经 ·

爱范儿 ·

美团技术团队 ·

本研究提出了一种新颖的全端到端口型同步框架LatentSync，基于音频条件的潜在扩散模型，旨在提高时序一致性和口型同步的准确性。

BriefGPT - AI 论文速递 ·

本研究提出了一系列基于音频驱动的说话人脸生成方法，包括高保真NeRF技术、统一面部标记生成器和两阶段生成模型，旨在提高口型同步和视觉质量。通过自我监督学习和新颖的扩散模型，解决了现有模型在唇形同步和视觉细节保留方面的不足，实验结果显示性能优于现有技术。

BriefGPT - AI 论文速递 ·

本文探讨了机器配音中的技术进展，包括利用神经网络模型改善音调控制、口型同步和翻译质量。研究提出了新的配音架构，强调保留语音特征的重要性，并展示了多人场景下的音频质量提升。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于2D口型视频和3D面部重构的3D面部动画模型，具有高保真度和良好的泛化能力，能够捕捉个体讲话风格，生成个性化的3D说话头像。通过实验验证了其有效性，并提出了新方法以提高口型同步和面部动画表现。

BriefGPT - AI 论文速递 ·

本文介绍了Learn2Talk学习框架、VividTalk视频生成系统和UniSinger歌唱动画框架等先进的3D面部动画和语音合成技术。这些技术通过结合音频、文本和面部特征，提高了语音驱动的面部动画质量，实现了高保真的口型同步和个性化表现。研究表明，特定数据集的使用对提升动画性能至关重要。

BriefGPT - AI 论文速递 ·