EARS: 一个用于语音增强和去混响的各向同性全频通话语音数据集的基准测试
原文中文,约400字,阅读约需1分钟。发表于: 。发布了 EARS(Expressive Anechoic Recordings of Speech)数据集,包含来自不同背景的 107 位说话者,总计 100 小时的干净、无混响的语音数据。数据集涵盖了多种不同的讲话风格,包括情感性语音、不同的阅读风格、非语言声音和自由对话式语音。通过一组仪器度量评估了数据集上的各种语音增强和去混响方法,并对语音增强任务进行了 20...
研究人员发布了EARS数据集,包含107位说话者的100小时干净无混响的语音数据,涵盖多种讲话风格,并评估了语音增强和去混响方法。还引入了盲测试集用于自动评估。