RepAugment:面向输入的表示层数据增强用于呼吸音分类

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本论文提出了使用自动编码说话人转换进行数据增强的方法,通过转换音频序列合成与另一位说话人类似的声音。该方法在英语到法语和英语到罗马尼亚语的自动语音翻译任务上效果更好。同时,证明了数据增强的数量和多样性的好处,并在英语到法语自动语音翻译任务上胜过一个非常强大的级联模型。该方法适用于其他语音生成和分析任务。

🎯

关键要点

  • 提出了使用自动编码说话人转换进行数据增强的方法。
  • 通过转换音频序列合成与另一位说话人类似的声音。
  • 该方法在英语到法语和英语到罗马尼亚语的自动语音翻译任务上效果更好。
  • 证明了数据增强的数量和多样性的好处。
  • 在英语到法语自动语音翻译任务上胜过一个强大的级联模型。
  • 该方法适用于其他语音生成和分析任务。
➡️

继续阅读