本文研究了使用神经网络进行环境声音分类的三种不同类型的表示:谱图、MFCC和嵌入式表示,并使用不同的CNN网络和自编码器来评估它们在分类准确度上的效果。发现使用谱图的分类准确度最高,使用MFCC的准确度最低,并提出了一些指导性的结论和方法来提高声音环境分类的准确度。
该研究使用卷积神经网络检测COVID-19,并使用谱图和F0等特征解释神经网络判定过程。结果显示谱图相关能量高的区域对决策过程起主导作用,同时F0也有帮助。研究表明,即使在训练集中存在虚假数据的情况下,所研究的模型也可以做出无偏差的决策。
完成下面两步后,将自动完成登录并继续当前操作。