基于WavLM嵌入的语音人口属性预测

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于WavLM特征的通用分类器,能够有效预测说话者的年龄、性别和母语等人口特征,显著提升了预测精度。

🎯

关键要点

  • 本研究提出了一种基于WavLM特征的通用分类器。
  • 该分类器能够有效预测说话者的年龄、性别、母语、教育和国家等人口特征。
  • 通过提取关键声学和语言特征,实现了年龄预测平均绝对误差(MAE)为4.94。
  • 性别分类准确率超过99.81%。
  • 显著提高了预测精度,为语音基础的人口剖析研究奠定了坚实基础。
➡️

继续阅读