一对一对话中通过面部表情检测听力损失

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本论文研究了唇语识别的两种模型:使用自注意力机制的CTC和序列到序列模型,以及唇语识别与音频识别的互补性。同时,介绍了新的数据集LRS2-BBC,并公开发布。实验结果表明,该模型的表现超过了以前的相关工作。

🎯

关键要点

  • 研究了唇语识别的两种模型:自注意力机制的CTC和序列到序列模型。
  • 探讨了唇语识别与音频识别在有噪音情况下的互补性。
  • 介绍并公开发布了新的数据集LRS2-BBC。
  • 实验结果显示该模型的表现超过了以前的相关工作。
➡️

继续阅读