本文介绍了SignAvatars数据集,包含70,000个手语视频,旨在促进3D手语识别与生成。提出了Spoken2Sign翻译系统,实现口语到手语的转换,并展示了3D关键点增强的辅助作用。研究还涉及基于扩散的SLP模型和SignGAN,以提升手语翻译效果。
介绍了Spoken2Sign系统,将口语翻译成手语。系统包括创建手语视频字典、估计3D手语和训练Spoken2Sign模型。作者还证明了该方法的两个附带产品的辅助作用。
完成下面两步后,将自动完成登录并继续当前操作。