LIP-RTVE:西班牙连续口语的音视数据库
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本论文研究了唇语识别的两种模型:使用自注意力机制的CTC和序列到序列模型。同时,介绍了新的数据集LRS2-BBC,并公开发布。实验结果表明,该模型在有噪音的情况下表现优于以前的相关工作。
🎯
关键要点
- 本论文研究唇语识别的两种模型:自注意力机制的CTC和序列到序列模型。
- 介绍并公开发布了新的数据集LRS2-BBC。
- 研究唇语识别在有噪音情况下与音频识别的互补性。
- 实验结果表明,该模型在有噪音的情况下表现优于以前的相关工作。
➡️