Auditory Perception-Based MOS Prediction Model for Synthetic Speech (APG-MOS)

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的听觉感知导向的MOS预测模型(APG-MOS),旨在改善自动语音质量评估中的主观感知模型不足。该模型结合生物听觉机制与语义分析,提高了与人类判断的一致性,实验结果表明其优于现有模型。

🎯

关键要点

  • 本研究提出了一种新的听觉感知导向的MOS预测模型(APG-MOS)。
  • APG-MOS旨在改善自动语音质量评估中的主观感知模型不足。
  • 该模型结合生物听觉机制与语义分析,提高了与人类判断的一致性。
  • 实验结果表明,APG-MOS在主要基准上的表现优于现有模型,具有显著的影响潜力。
➡️

继续阅读