SignMusketeers:大规模手语翻译的高效多流方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了在连续手语识别和翻译中添加多模态信息的机制,通过将光流信息与 RGB 图像结合,丰富了与运动相关的特征。我们的方法在 RWTH-PHOENIX-2014 数据集上评估,手语识别任务中词错误率降低了0.9,翻译任务中测试集上的大多数 BLEU 得分提高了约0.6。
🎯
关键要点
- 研究了在连续手语识别和翻译中添加多模态信息的机制。
- 通过将光流信息与 RGB 图像结合,丰富了与运动相关的特征。
- 使用轻量级插件,不需要单独的特征提取器。
- 在手语识别和翻译任务中应用了这些改变,提高了性能。
- 在 RWTH-PHOENIX-2014 数据集上评估,手语识别任务中词错误率降低了 0.9。
- 翻译任务中,测试集上的大多数 BLEU 得分提高了约 0.6。
➡️