小红花·文摘

本研究针对文本到语音（TTS）评估中的一致性和稳健性问题，提出了改进的MUSHRA测试变体，以解决参考匹配偏差和评判模糊性。此外，研究发布了包含47,100个汉语和泰米尔语评分的MANGO数据集，旨在支持人类偏好分析和自动评估指标的开发。