快手开源LivePortrait，GitHub 6.6K Star，实现表情姿态极速迁移

机器之心 ·

快手开源LivePortrait，GitHub 6.6K Star，实现表情姿态极速迁移

💡 原文中文，约7200字，阅读约需18分钟。

📝

内容提要

快手可灵大模型团队开源了名为LivePortrait的人像视频生成框架，能够将驱动视频的表情、姿态迁移到静态或动态人像视频上，生成极具表现力的视频结果。该框架已在快手的多个业务中落地，并将继续探索新的应用方式。

🎯

关键要点

快手可灵大模型团队开源了LivePortrait人像视频生成框架。
LivePortrait能够实时将驱动视频的表情和姿态迁移到静态或动态人像视频上。
该框架已在快手的多个业务中应用，并将继续探索新的应用方式。
LivePortrait在GitHub上获得了6.4K Stars和550 Forks，受到广泛关注。
LivePortrait采用69M高质量训练帧和视频-图片混合训练策略，提升生成能力和可控性。
模型训练分为基础模型训练和贴合与重定向模块训练两个阶段。
第一阶段使用高质量训练数据和升级的网络结构，提升模型的泛化性和效率。
第二阶段设计了贴合模块和重定向模块，以解决跨身份驱动时的眼部和嘴部问题。
LivePortrait在同身份和跨身份驱动中表现优异，生成质量和驱动精确度较高。
该框架支持多人合照驱动和动物肖像驱动，拓宽了实际应用场景。
LivePortrait已在快手的多个业务落地，并将探索多模态驱动的人像视频生成。

❓

延伸问答

LivePortrait是什么？

LivePortrait是快手可灵大模型团队开源的人像视频生成框架，能够实时将驱动视频的表情和姿态迁移到静态或动态人像视频上。

LivePortrait的技术优势是什么？

LivePortrait采用69M高质量训练帧和视频-图片混合训练策略，提升了生成能力和可控性，同时在生成速度和效率上表现优异。

LivePortrait的应用场景有哪些？

LivePortrait已在快手的多个业务中应用，包括快手魔表、快手私信、快影的AI表情玩法等，并支持多人合照和动物肖像驱动。

LivePortrait的训练过程是怎样的？

LivePortrait的训练分为两个阶段：基础模型训练和贴合与重定向模块训练，使用高质量数据和升级的网络结构以提升模型性能。

LivePortrait在GitHub上的表现如何？

LivePortrait在GitHub上获得了6.4K Stars和550 Forks，受到广泛关注，并在开源社区中获得好评。

LivePortrait如何处理跨身份驱动的问题？

LivePortrait设计了贴合模块和重定向模块，以解决跨身份驱动时的眼部和嘴部问题，确保生成的表情自然且准确。

🏷️

继续阅读

阿里开源Open Code Review：一款AI代码评审命令行工具
阿里巴巴开源的Open Code Review（OCR）是一款AI代码审查工具，能够自动审查Git提交和代码变更。它通过分析代码库，识别潜在的空指针、线程...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
知识图谱+本地存储：开源Mnemo给AI配的长期记忆中枢
Mnemo是为大语言模型设计的本地优先长期记忆层，旨在解决AI每次会话忘记上下文的问题。它通过构建知识图谱存储历史对话和信息，帮助AI在后续提问中自动召回...
开源界的马戏团怪人
本文讨论了Terry A. Davis和Kent Overstreet的心理健康危机。Davis创造了TempleOS，尽管技术成就有限，但因精神疾病而受...
GitHub宇宙回来了：在代理时代，我们齐心协力
在2026年Microsoft Build大会上，GitHub推出了新工具和更新，旨在提升用户体验。用户可以在VS Code或CLI中开始工作，然后在手机...