本研究针对应用语音基础模型(SFM)进行听障人士语音可懂性预测的不足,开展了全面的研究。通过分析编码层选择、预测头架构和集成配置等关键设计因素,我们提出选择单一编码层和时域建模对预测效果的显著影响,并发现多个SFM的集成能够有效提升性能。研究为有效适应SFM以提高听障人群的语音可懂性预测提供了实用见解。
本研究探讨了语音基础模型在听障人士语音可懂性预测中的不足,分析了编码层选择和预测头架构等因素,强调了单一编码层和时域建模的重要性,并发现多个模型集成显著提升了性能,为提高听障人群的语音可懂性提供了实用见解。