本文介绍了一种自我监督的方法,将未标记的语音分割成类似词的段落。通过两阶段的动态规划方法,进行零资源分割,无需学习明确的词汇表。使用 HuBERT 替换特征,并通过聚类获得词汇表。该方法在 ZeroSpeech 基准测试中达到了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。