本研究针对中文分词中的词边界识别问题,采用语音-文本平行数据和Montreal Forced Aligner工具进行字符级对齐,提出了一种基于概率的过滤策略,实验结果表明该方法有效提升了分词性能。
完成下面两步后,将自动完成登录并继续当前操作。