基于WavLM嵌入的语音人口属性预测
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于WavLM特征的通用分类器,能够有效预测说话者的年龄、性别和母语等人口特征,显著提升了预测精度。
🎯
关键要点
- 本研究提出了一种基于WavLM特征的通用分类器。
- 该分类器能够有效预测说话者的年龄、性别、母语、教育和国家等人口特征。
- 通过提取关键声学和语言特征,实现了年龄预测平均绝对误差(MAE)为4.94。
- 性别分类准确率超过99.81%。
- 显著提高了预测精度,为语音基础的人口剖析研究奠定了坚实基础。
➡️