超越言语 -- 为沟通生成整体性的三维人类二人运动
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一个创新任务,重点关注人类沟通,旨在生成说话者和听众的三维整体人体动作。通过因子分解与文本语义信息相结合,生成真实和协调的动作。方法在两个基准数据集上展示出最先进的性能。
🎯
关键要点
- 本文介绍了一个创新任务,重点关注人类沟通。
- 任务旨在生成说话者和听众的三维整体人体动作。
- 方法核心是将因子分解与文本语义信息相结合,以生成更真实和协调的动作。
- 分别训练 VQ-VAEs 处理说话者和听众的整体动作。
- 考虑说话者和听众之间的实时相互影响。
- 提出了一种新颖的基于链式变换器的自回归模型,专门用于描述现实世界的沟通场景。
- 可以同时生成说话者和听众的动作,确保结果协调且多样化。
- 方法在两个基准数据集上展示出最先进的性能。
- 介绍了 HoCo 整体沟通数据集,作为未来研究的宝贵资源。
- HoCo 数据集和代码将在被接受后用于研究目的发布。
➡️