开发有效的训练数据集以提高基于人工智能的说话人分离系统性能 原文中文,约300字,阅读约需1分钟。发表于:2024-11-13T00:00:00Z。 本研究解决了说话人分离中的问题,即现有模型在真实录音环境中表现不佳,主要由于训练数据集缺乏真实性。我们提出了一种新颖的构建训练数据集的方法,包含混合信号及每位说话人的相应真实信号,评估结果显示其在真实混音条件下,性能提升1.65 dB,展示了现实训练集在提升说话人分离模型性能方面的潜力。 本研究提出了一种新方法,构建包含混合信号和真实信号的训练数据集,以解决说话人分离问题。评估结果表明,在真实混音条件下,性能提升了1.65 dB,验证了现实训练集的有效性。 人工智能 性能提升 数据集 混合信号 真实信号 训练数据集 说话人分离