本文提出了一种无监督的语音分割方法,克服了传统方法在多种声学风格变化中的局限性。研究表明,该方法在边界检测和分段纯度方面优于现有基线,对语音处理技术的改进具有重要意义。
本文介绍了一种自我监督的方法,将未标记的语音分割成类似词的段落。通过两阶段的动态规划方法,进行零资源分割,无需学习明确的词汇表。使用 HuBERT 替换特征,并通过聚类获得词汇表。该方法在 ZeroSpeech 基准测试中达到了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。