本文介绍了在自监督学习中,通过基于数据的单元发现在语音处理领域取得了新的进展。通过自蒸馏目标函数对预训练的HuBERT进行微调,并添加一个汇总整个句子的聚合器标记。实验结果显示,该模型在语音中画定了明确的边界,并且帧之间的表示显示出显著的音节结构。同时,提出了一个新的基准任务用于评估语音句子级表示。与先前的模型相比,该模型在无监督音节发现和学习句子级表示方面表现出色。
完成下面两步后,将自动完成登录并继续当前操作。