小红花·文摘

Spatial LibriSpeech是一个包含超过650小时的19通道音频的空间音频数据集，用于机器学习模型训练。该数据集包含源位置、说话方向、房间声学和几何标签。通过对四个空间音频任务进行模型训练，结果表明该数据集在3D源定位、距离、T30和DRR估计方面具有良好的性能，并在评估数据集上表现出良好的泛化能力。