让对话机器人 Rasa (二):支持中文
💡
原文中文,约7900字,阅读约需19分钟。
📝
内容提要
本文介绍了如何在Rasa中支持中文对话,包括配置中文pipeline、增加中文语料、训练模型、添加中文回复和解决训练nlu时可能遇到的异常情况。测试结果表明已经支持中文回复。
🎯
关键要点
- Rasa 默认不支持中文对话,需要进行配置。
- 可以从简单的中文 pipeline 开始配置,例如使用医疗机器人的 nlu 配置示例。
- NLU 是自然语言理解的缩写,主要用于解析用户输入,识别意图和实体。
- 在 nlu.yml 中增加中文语料以支持中文意图识别。
- 训练模型时,tf_model.h5 文件较大,但训练出来的模型文件相对较小。
- 测试中文意图识别的效果,确认支持中文。
- 在 domain.yml 中添加中文回复以支持中文回复。
- 重新训练模型以包含回复逻辑,注意不要带 nlu 参数。
- 启动 Rasa shell 测试中文对话,确认支持中文回复。
- 解决训练 nlu 时可能遇到的异常,例如缺少 jieba 和 transformers 包。
➡️