通过比较有噪声的正负音频录音进行目标说话人提取
📝
内容提要
本研究解决了在多说话人环境中提取特定说话人声音的难题,尤其是当缺乏干净音频样本时。通过对比目标说话人说话的音频片段(正录音)与未说话的片段(负录音),提出了一种新方法,实验结果表明该方法在现实场景中具有优越的性能,展现了良好的普适性。
➡️
本研究解决了在多说话人环境中提取特定说话人声音的难题,尤其是当缺乏干净音频样本时。通过对比目标说话人说话的音频片段(正录音)与未说话的片段(负录音),提出了一种新方法,实验结果表明该方法在现实场景中具有优越的性能,展现了良好的普适性。