本研究通过微调听觉大型语言模型,解决了传统语音质量评估需多方面评分的问题。模型可预测平均意见分数、说话者相似度,并进行A/B测试和生成自然语言描述。实验显示,该模型在语音质量预测上与先进小型模型相当,且在A/B测试和自然语言描述中表现良好。
完成下面两步后,将自动完成登录并继续当前操作。