Rasa NLU pipeline 组件列表
💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
本文介绍了 Rasa NLU 的重要组件,包括语言模型、分词组件、特征提取组件、意图分类组件和实体提取器。推荐使用 SpacyNLP 作为语言模型,分词组件可选 JiebaTokenizer、MitieTokenizer 或 SpacyTokenizer。特征提取组件可使用 RegexFeaturizer 等多个组件。意图分类组件包括 MitieIntentClassifier、LogisticRegressionClassifier、SklearnIntentClassifier、KeywordIntentClassifier、DIETClassifier 和 FallbackClassifier。nlu.yml 是训练数据,可用于智能识别意图。
🎯
关键要点
- Rasa NLU 的重要组件包括语言模型、分词组件、特征提取组件、意图分类组件和实体提取器。
- 推荐使用 SpacyNLP 作为语言模型,需指定模型文件,中文模型有多个版本可供选择。
- 分词组件包括 WhitespaceTokenizer、JiebaTokenizer、MitieTokenizer 和 SpacyTokenizer。
- 特征提取组件可使用 RegexFeaturizer 等多个组件来提取特征。
- 意图分类组件包括 MitieIntentClassifier、LogisticRegressionClassifier、SklearnIntentClassifier、KeywordIntentClassifier、DIETClassifier 和 FallbackClassifier。
- nlu.yml 文件用于训练数据,帮助智能识别意图。
➡️