基于 BERT 和 Levenshtein 距离的全面拼写纠错方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究介绍了阿拉伯语拼写纠正框架AraSpell,实验证明其有效性,词错误率为4.8%,字符错误率为1.11%。
🎯
关键要点
- 本研究介绍了阿拉伯语拼写纠正框架AraSpell。
- 使用不同的seq2seq模型架构进行错误注入,包括递归神经网络(RNN)和Transformer。
- 通过实验研究证明了AraSpell的有效性。
- 词错误率(WER)为4.8%,字符错误率(CER)为1.11%。
- 与标记数据相比,CER为2.9%,WER为10.65%。
- 实验结果基于一个包含100K个句子的测试集。
➡️