本文研究了使用神经网络进行环境声音分类的三种不同类型的表示:谱图、MFCC和嵌入式表示,并使用不同的CNN网络和自编码器来评估它们在分类准确度上的效果。发现使用谱图的分类准确度最高,使用MFCC的准确度最低,并提出了一些指导性的结论和方法来提高声音环境分类的准确度。
完成下面两步后,将自动完成登录并继续当前操作。