小红花·文摘

本文研究了使用神经网络进行环境声音分类的三种不同类型的表示：谱图、MFCC和嵌入式表示，并使用不同的CNN网络和自编码器来评估它们在分类准确度上的效果。发现使用谱图的分类准确度最高，使用MFCC的准确度最低，并提出了一些指导性的结论和方法来提高声音环境分类的准确度。