ARTE在其流媒体平台上推出增强版MPEG-H Dialog+,提高电影和音乐会的语音清晰度。该技术可分离对话与背景音频,用户可以切换音轨,旨在改善听力障碍人士的观看体验,确保对话清晰且不影响音乐质量。
本文介绍了一种新的动态门控递归神经网络(DG-RNN),用于资源受限硬件平台上的语音增强计算。该网络通过新增的选择门在每个步骤只更新一部分神经元,从而降低计算成本。实验结果表明,该模型在语音清晰度和质量指标上与基线模型相当,同时计算需求减少了50%。
完成下面两步后,将自动完成登录并继续当前操作。