让对话机器人 Rasa (二):支持中文

💡 原文中文,约7900字,阅读约需19分钟。
📝

内容提要

本文介绍了如何在Rasa中支持中文对话,包括配置中文pipeline、增加中文语料、训练模型、添加中文回复和解决训练nlu时可能遇到的异常情况。测试结果表明已经支持中文回复。

🎯

关键要点

  • Rasa 默认不支持中文对话,需要进行配置。
  • 可以从简单的中文 pipeline 开始配置,例如使用医疗机器人的 nlu 配置示例。
  • NLU 是自然语言理解的缩写,主要用于解析用户输入,识别意图和实体。
  • 在 nlu.yml 中增加中文语料以支持中文意图识别。
  • 训练模型时,tf_model.h5 文件较大,但训练出来的模型文件相对较小。
  • 测试中文意图识别的效果,确认支持中文。
  • 在 domain.yml 中添加中文回复以支持中文回复。
  • 重新训练模型以包含回复逻辑,注意不要带 nlu 参数。
  • 启动 Rasa shell 测试中文对话,确认支持中文回复。
  • 解决训练 nlu 时可能遇到的异常,例如缺少 jieba 和 transformers 包。
➡️

继续阅读