小红花·文摘

本研究针对中文分词中的词边界识别问题，采用语音-文本平行数据和Montreal Forced Aligner工具进行字符级对齐，提出了一种基于概率的过滤策略，实验结果表明该方法有效提升了分词性能。