本研究提出了一种新的听觉感知导向的MOS预测模型(APG-MOS),旨在改善自动语音质量评估中的主观感知模型不足。该模型结合生物听觉机制与语义分析,提高了与人类判断的一致性,实验结果表明其优于现有模型。
本文探讨了脉冲神经网络(SNN)在语音识别中的应用,展示了其在性能和抗梯度爆炸方面的优势。研究表明,代理梯度方法能够有效训练SNN,优化其动态行为,并为基于脉冲信号的神经计算提供新的监督学习算法。此外,提出的Spiketrum模型实现了高效的脉冲编码,推动了听觉感知任务的发展。
完成下面两步后,将自动完成登录并继续当前操作。