基于预训练BERT提取语义特征的端到端框架的中文多音字消歧

📝

内容提要

本研究解决了中文普通话文本转语音系统中的多音字消歧问题,提出了一种端到端框架,无需任何预处理,通过输入包含多音字的句子来预测其发音。研究发现,利用预训练的BERT模型提取语义特征并结合神经网络分类器,显著提高了多音字消歧的表现,且上下文信息对消歧过程的影响也得到了探讨。

🏷️

标签

➡️

继续阅读