LocSelect: 带有听觉选择性听觉定位机制的目标说话人定位

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文提出了一种具有选择性听觉机制的目标讲话者定位算法,通过给定目标讲话者的参考语音,消除干扰讲话者的语音,在经过长短期记忆网络提取过滤后的频谱图中的目标讲话者的位置。实验证实了该方法在不同尺度不变信噪比条件下相比现有算法的优越性。

原文中文,约300字,阅读约需1分钟。
阅读原文