结合声学和调制谱图的基于注意力 LSTM 系统用于语音可懂性水平分类

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

我们提出了一种名为TLDNN的混合深度框架,将Transformer和LSTM相结合,通过自注意机制建模信号序列的全局相关性以增强时间依赖性的捕捉,并采用数据增强策略来提高模型对调制相关特征的鲁棒性。实验结果表明,该方法在广泛使用的数据集上取得了最先进的性能并具有显著优势。

🎯

关键要点

  • 自动调制识别在无线通信系统中起着关键作用。
  • 提出了一种名为TLDNN的混合深度框架。
  • TLDNN结合了Transformer和LSTM的结构。
  • 通过自注意机制建模信号序列的全局相关性。
  • 增强时间依赖性的捕捉。
  • 采用段替换(SS)的数据增强策略。
  • 提高模型对调制相关特征的鲁棒性。
  • 实验结果表明该方法在广泛使用的数据集上取得了最先进的性能。
  • 该方法在复杂性方面具有显著优势。
➡️

继续阅读