启用听觉大型语言模型进行自动语音质量评估
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了传统语音质量评估中需多方面评分的难题。通过对听觉大型语言模型进行特定任务的微调,能够预测平均意见分数、说话者相似度及进行A/B测试,同时生成更具可解释性的自然语言描述。实验结果显示,听觉大型语言模型在预测语音质量方面与最先进的小型模型表现相当,并在A/B测试和自然语言描述中展现出良好效果。
本研究通过微调听觉大型语言模型,解决了传统语音质量评估需多方面评分的问题。模型可预测平均意见分数、说话者相似度,并进行A/B测试和生成自然语言描述。实验显示,该模型在语音质量预测上与先进小型模型相当,且在A/B测试和自然语言描述中表现良好。