Spatial LibriSpeech是一个包含超过650小时的19通道音频的空间音频数据集,用于机器学习模型训练。该数据集包含源位置、说话方向、房间声学和几何标签。通过对四个空间音频任务进行模型训练,结果表明该数据集在3D源定位、距离、T30和DRR估计方面具有良好的性能,并在评估数据集上表现出良好的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。