描述你所在的位置:通过环境的文本描述改善语音情感识别的噪音鲁棒性

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

通过训练文本导向、环境感知的模型,将预训练文本编码器提取的文本环境嵌入到基于Transformer的SER模型中,改善了SER系统在噪声条件下的性能。在低信噪比条件下,该方法在唤醒情感、支配和愉悦度上的性能提升分别达到31.8%、23.5%和9.5%。

🎯

关键要点

  • 通过训练文本导向、环境感知的模型,改善了SER系统在噪声条件下的性能。
  • 该方法将预训练文本编码器提取的文本环境嵌入到基于Transformer的SER模型中。
  • 在低信噪比条件下,该方法在唤醒情感、支配和愉悦度上的性能提升分别达到31.8%、23.5%和9.5%。
  • 研究证明文本环境描述通过大型语言模型产生的表示改善了SER系统的噪声鲁棒性。
➡️

继续阅读