Auditory Perception-Based MOS Prediction Model for Synthetic Speech (APG-MOS)
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的听觉感知导向的MOS预测模型(APG-MOS),旨在改善自动语音质量评估中的主观感知模型不足。该模型结合生物听觉机制与语义分析,提高了与人类判断的一致性,实验结果表明其优于现有模型。
🎯
关键要点
- 本研究提出了一种新的听觉感知导向的MOS预测模型(APG-MOS)。
- APG-MOS旨在改善自动语音质量评估中的主观感知模型不足。
- 该模型结合生物听觉机制与语义分析,提高了与人类判断的一致性。
- 实验结果表明,APG-MOS在主要基准上的表现优于现有模型,具有显著的影响潜力。
➡️