BriefGPT - AI 论文速递 ·

怪异程度：使用语言模型进行通用异常检测

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了一种利用神经句向量和异常检测技术检测短文本中的错误和独特样本的方法。研究提出了新的数据采集流程，有效去除错误数据并挖掘独特数据，从而提升意图分类和槽位填充模型的鲁棒性。此外，探讨了大型语言模型在异常检测中的应用，提出多种度量方法以改善模型的效率和安全性。

🎯

❓

可以通过使用神经句向量和基于距离的异常检测技术来检测短文本中的错误和独特样本。

该流程能够有效去除错误数据并自动挖掘独特数据，从而提升意图分类和槽位填充模型的鲁棒性。

大型语言模型可以用于风险识别、预测建模和趋势分析等方面，并通过不同机制检测不同类型的语言异常。

AnomaLLMy是一种新技术，用于通过API自动检测黑盒大型语言模型中的异常标记。

可以使用熵、基尼不纯度和质心距离等度量方法来量化对给定提示的响应的多样性误差。

异常标志词“glitch tokens”在嵌入空间中聚类，表明它们在大型语言模型中存在分词相关错误。

🏷️