本研究针对文本到语音(TTS)评估中的一致性和稳健性问题,提出了改进的MUSHRA测试变体,以解决参考匹配偏差和评判模糊性。此外,研究发布了包含47,100个汉语和泰米尔语评分的MANGO数据集,旨在支持人类偏好分析和自动评估指标的开发。
完成下面两步后,将自动完成登录并继续当前操作。