小红花·文摘

使用亚马逊Lex构建聊天机器人

DEV Community ·

本研究提出了一种新方法，通过结合意图分类和超出范围检测，利用交叉熵损失和自动编码器的嵌入重构损失，提高了虚拟助手系统中拒绝超出范围查询的准确度1-4%，同时保持意图分类性能。

针对意图分类和超出范围检测任务的句子变换器微调的新方法

BriefGPT - AI 论文速递 ·

本研究评估了大型语言模型在银行业聊天机器人意图分类中的应用。结果显示，精调的SlovakBERT在准确性和假阳性率方面优于多语言生成模型，确立了其基准地位。

通过大型语言模型微调进行银行聊天机器人的意图分类

BriefGPT - AI 论文速递 ·

本文介绍了一种利用描述增强的嵌入相似性进行无数据的意图分类的方法。通过实验和比较，结果显示该方法对于未见过的意图具有良好的扩展性，并相比零样本基线获得了显著改进。作者还提供了定性错误分析，以指导未来的研究。

探索基于描述增强的无数据意图分类

BriefGPT - AI 论文速递 ·

通过众包开发了包含22k个发言、15个领域和1061个对话的波斯语对话数据集，并进行了标注以训练模型。提出了用于自然语言理解任务的基准模型，意图分类和实体抽取的F-1得分分别约为91％和93％，可作为未来研究的基准。

PRFashion24：波斯语时尚产品评论情感分析数据集

BriefGPT - AI 论文速递 ·

通过众包开发了一个波斯语对话数据集，包含22k个发言、15个领域和1061个对话。标注并训练了模型，提出了用于自然语言理解任务的基准模型，意图分类F-1得分约为91%，实体抽取F-1得分约为93%。可作为未来研究的基准。

PerSHOP -- 波斯购物对话系统建模的数据集

BriefGPT - AI 论文速递 ·

本文提出了少样本意图分类和槽填充的新任务，并通过三个公共数据集的少样本分割建立基准。研究发现，元学习算法和原型网络算法在基准上优于fine-tuning基线。预训练的语言模型与这些小样本算法相结合，可以进一步提高模型性能。

少样本意图分类与槽位填充的表示和知识分离

BriefGPT - AI 论文速递 ·

本研究提出了一种名为RankAug的文本排名方法，通过多样性的词汇和句法，检测和过滤出最具相似意义的顶级增强文本，从而改善生成数据过滤在自然语言理解任务中的性能，特别是意图和情感分类。实验结果表明，过滤技术的精心选择可以显著提高少数派分类的准确性，提高了多达35%。

RankAug: 文本分类的增强数据排名

BriefGPT - AI 论文速递 ·

该研究评估了不同尺寸的预训练语言模型在口语语言理解方面的表现。最大的模型在意图分类准确性方面表现良好，但在槽填充方面表现不佳，并且对ASR错误敏感。

本文介绍了 Rasa NLU 的重要组件，包括语言模型、分词组件、特征提取组件、意图分类组件和实体提取器。推荐使用 SpacyNLP 作为语言模型，分词组件可选 JiebaTokenizer、MitieTokenizer 或 SpacyTokenizer。特征提取组件可使用 RegexFeaturizer 等多个组件。意图分类组件包括 MitieIntentClassifier、LogisticRegressionClassifier、SklearnIntentClassifier、KeywordIntentClassifier、DIETClassifier 和 FallbackClassifier。nlu.yml 是训练数据，可用于智能识别意图。

Rasa NLU pipeline 组件列表

大象笔记 - Notes of Elephant Leg ·

使用亚马逊Lex构建聊天机器人

针对意图分类和超出范围检测任务的句子变换器微调的新方法

通过大型语言模型微调进行银行聊天机器人的意图分类

探索基于描述增强的无数据意图分类

PRFashion24：波斯语时尚产品评论情感分析数据集

PerSHOP -- 波斯购物对话系统建模的数据集

少样本意图分类与槽位填充的表示和知识分离

RankAug: 文本分类的增强数据排名

ChatGPT 是一个可能的零射依赖分析器

Rasa NLU pipeline 组件列表