AV-CrossNet: 一种用于语音分离的音视频复杂频谱映射网络,利用窄频和交叉频带建模
发表于: 。添加视觉线索到基于音频的语音分离可以提高分离性能。本文介绍了一种名为 AV-CrossNet 的音视系统,用于语音增强、目标说话人提取和多说话人分离。AV-CrossNet 扩展自 CrossNet...
添加视觉线索到基于音频的语音分离可以提高分离性能。本文介绍了一种名为 AV-CrossNet 的音视系统,用于语音增强、目标说话人提取和多说话人分离。AV-CrossNet 扩展自 CrossNet...