小红花·文摘 - 小红花技术领袖俱乐部

语音基础模型在可穿戴传感器数据时间序列任务中的泛化

语音基础模型在可穿戴传感器数据时间序列任务中的泛化

Apple Machine Learning Research ·

本研究探讨了语音基础模型在听障人士语音可懂性预测中的不足，分析了编码层选择和预测头架构等因素，强调了单一编码层和时域建模的重要性，并发现多个模型集成显著提升了性能，为提高听障人群的语音可懂性提供了实用见解。

Revealing Best Practices for Predicting Speech Intelligibility in Hearing-Impaired Individuals Using Speech Foundation Models

BriefGPT - AI 论文速递 ·

本研究提出了一种利用语音基础模型自动验证众包语音数据的方法，显著降低验证成本并提高效率。实验结果表明，该方法可节省40%以上的验证成本，同时保持数据质量，为语音数据获取开辟了新机遇。

Voice Foundation Models and Crowdsourcing: Methods for Efficient and High-Quality Data Collection

BriefGPT - AI 论文速递 ·