Revealing Best Practices for Predicting Speech Intelligibility in Hearing-Impaired Individuals Using Speech Foundation Models

本研究针对应用语音基础模型（SFM）进行听障人士语音可懂性预测的不足，开展了全面的研究。通过分析编码层选择、预测头架构和集成配置等关键设计因素，我们提出选择单一编码层和时域建模对预测效果的显著影响，并发现多个SFM的集成能够有效提升性能。研究为有效适应SFM以提高听障人群的语音可懂性预测提供了实用见解。

本研究探讨了语音基础模型在听障人士语音可懂性预测中的不足，分析了编码层选择和预测头架构等因素，强调了单一编码层和时域建模的重要性，并发现多个模型集成显著提升了性能，为提高听障人群的语音可懂性提供了实用见解。

models 听障人士模型集成编码层语音可懂性语音基础模型