本研究开发了一种伪注释管道,利用手语视频和英语生成可能的注释,包括时间间隔和手势分类。通过建立基线模型,取得了在手语数据集上的最佳表现。专业翻译人员为ASL STEM Wiki的近500个视频进行了注释,并发布了300小时的伪注释数据,以支持手语生成系统的改进。
完成下面两步后,将自动完成登录并继续当前操作。