小红花·文摘

结合LLM嵌入和HDBSCAN的非结构化文本聚类

MachineLearningMastery.com ·

使用大语言模型嵌入在Scikit-learn中进行文档聚类

MachineLearningMastery.com ·

该研究提出了一种名为TECL的框架，旨在解决基于大型语言模型的文本聚类中的高计算和财务开销问题。TECL利用LLM反馈，在有限查询预算下实现高效且准确的无监督文本聚类，实验结果表明其在相同成本下优于现有方案。

Cost-Effective Text Clustering with Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，利用大型语言模型（LLM）优化对话意图聚类，解决传统文本聚类与人类感知不匹配的问题。经过验证，精调的LLM在语义连贯性和聚类命名上表现优越，意图发现的应用效果显著，定量指标提高6.25%，应用层面性能提升12%。

Dial-In LLM: Human-Aligned Dialogue Intent Clustering

BriefGPT - AI 论文速递 ·

三种自然语言聚类分析处理的工具和使用体验

dotNET跨平台 ·

本文探讨了文本嵌入、降维技术和漂移检测方法在文本数据分析中的有效性，强调了高维数据处理的挑战及深度学习在特征提取中的应用。研究提出了一种新工作流程，评估特征空间的稳定性，并揭示其对模型可解释性的影响。此外，分析了多语言模型在语义文本相似性任务中的表现，强调了文本聚类方法的改进和数据分布度量的有效性。