美团技术团队 ·

美团 LongCat-Video-Avatar 正式发布，实现开源 SOTA 级拟真表现

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展，支持多任务生成，提升了动作拟真度和长视频稳定性，解决了身份一致性问题，广泛应用于影视和教育等领域。

🎯

关键要点

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展。
LongCat-Video-Avatar支持多任务生成，包括Audio-Text-to-Video和视频续写等功能。
该模型在动作拟真度、长视频稳定性和身份一致性方面实现了显著突破。
LongCat-Video-Avatar通过解耦无条件引导技术，使虚拟人能够自然地进行微动作。
Cross-Chunk Latent Stitching训练策略解决了长视频生成中的视觉质量退化问题。
引入带位置编码的参考帧注入模式，提升了长视频中的身份一致性。
LongCat-Video-Avatar在多个权威数据集上达到SOTA领先水平。
在大规模人工评测中，LongCat-Video-Avatar在自然度与真实感方面表现优异。
该模型在影视娱乐、日常生活和知识教育等场景中展现出强泛化能力。
开源旨在促进共创，鼓励开发者反馈与参与技术迭代。

🏷️

继续阅读

修复Pingora开源框架中的请求走私漏洞
2025年12月，Cloudflare发现Pingora框架存在HTTP/1.x请求走私漏洞，编号CVE-2026-2833、CVE-2026-2835和...
卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...
AirPods长眼睛、MacBook加触控：苹果将推三款Ultra级新品
【TechWeb】在逐步完善Apple Watch SE、入门款iPad及MacBook Neo等中低端产品线布局后，苹果正酝酿一场深刻的品牌战略转型。据...
Windows 11日历集成还未推出微软称需要继续优化体验(可能放弃WebView?)
#系统资讯 Windows 11 通知中心的日历集成还未推出，微软称需要继续优化体验，确保提供可靠和高质量的功能。在去年 12 月微软在 Windows ...
华为发布五大创新解决方案，推动交通运输行业智能化转型
在2026年巴塞罗那MWC上，华为推出五大创新解决方案，推动交通运输智能化转型，涵盖城市智能交通、铁路通信、海关大数据和港口调度等领域，标志着技术突破与合作进展。

美团 LongCat-Video-Avatar 正式发布，实现开源 SOTA 级拟真表现

内容提要

关键要点

标签

继续阅读