研究提出了一种名为MAST的多尺度音频谱变换器,通过分层表示学习提高音频分类效率。在多个数据集上,MAST的准确度比AST提高了22.2%、4.4%和4.7%,同时更高效。
完成下面两步后,将自动完成登录并继续当前操作。