超越言语 -- 为沟通生成整体性的三维人类二人运动

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一个创新任务,重点关注人类沟通,旨在生成说话者和听众的三维整体人体动作。通过因子分解与文本语义信息相结合,生成真实和协调的动作。方法在两个基准数据集上展示出最先进的性能。

🎯

关键要点

  • 本文介绍了一个创新任务,重点关注人类沟通。
  • 任务旨在生成说话者和听众的三维整体人体动作。
  • 方法核心是将因子分解与文本语义信息相结合,以生成更真实和协调的动作。
  • 分别训练 VQ-VAEs 处理说话者和听众的整体动作。
  • 考虑说话者和听众之间的实时相互影响。
  • 提出了一种新颖的基于链式变换器的自回归模型,专门用于描述现实世界的沟通场景。
  • 可以同时生成说话者和听众的动作,确保结果协调且多样化。
  • 方法在两个基准数据集上展示出最先进的性能。
  • 介绍了 HoCo 整体沟通数据集,作为未来研究的宝贵资源。
  • HoCo 数据集和代码将在被接受后用于研究目的发布。
➡️

继续阅读