本文提出了适用于音频数据的数据增强方案,并探究了它们对预测性能的影响。同时,证明了采用时频音频特征训练,在监督和对比损失同时约束下的模型可以获得优秀的音频表示。该方法在少量标注数据的情况下,明显地改善了预测性能,比自监督训练更快地收敛并具有更好的表示能力。
完成下面两步后,将自动完成登录并继续当前操作。