该研究使用大型语言模型(LLMs)的文本嵌入和聚类算法,评估了文本聚类方法对数据集的影响。结果显示,LLMs嵌入在捕捉结构化语言的细微差别方面表现出色,BERT在性能方面领先于其他轻量级选择。增加嵌入维度和使用摘要技术并不能统一提高聚类效率。该研究扩展了传统文本聚类框架,为改进方法学和文本分析开辟了新的研究方向。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: