基于中间 ASR 特征和人类记忆模型的面向听障用户的非侵入式语音可懂度预测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究使用神经网络和自监督、弱监督模型的中间层特征表示,结合人类记忆的心理模型,预测助听器用户的可懂度评级,并在不同任务和训练数据中取得了显着性能提升。

🎯

关键要点

  • 本研究使用神经网络和自监督、弱监督模型的中间层特征表示。
  • 结合人类记忆的心理模型进行助听器用户可懂度评级的预测。
  • 在不同任务和训练数据中取得显著性能提升。
  • 相较于基础系统,均方根误差从28.7降低到25.3。
➡️

继续阅读