小红花·文摘

本文提出了适用于音频数据的数据增强方案，并探究了它们对预测性能的影响。同时，证明了采用时频音频特征训练，在监督和对比损失同时约束下的模型可以获得优秀的音频表示。该方法在少量标注数据的情况下，明显地改善了预测性能，比自监督训练更快地收敛并具有更好的表示能力。