机器能否区分语音中的高低社交裂纹

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了数据分割策略对口吃检测系统性能的影响,采用wav2vec 2.0和支持矢量机(SVM)进行检测。分析SEP-28k数据集后发现其演讲者数量有限,评估存在困难。为此,创建了扩展版SEP-28k数据集,增加了演讲者和性别信息,并提出多种数据分割方法以改进口吃检测的评估效果。

🎯

关键要点

  • 研究数据分割策略对口吃检测系统性能的影响
  • 使用wav2vec 2.0模型和支持矢量机(SVM)进行口吃检测
  • 分析SEP-28k数据集发现演讲者数量有限,评估存在困难
  • 创建扩展版SEP-28k数据集,增加演讲者和性别信息
  • 提出多种数据分割方法以改进口吃检测的评估效果
➡️

继续阅读