本文提出了一种加速球形K均值聚类算法,针对大规模高维稀疏文档数据集,显著减少相似性计算中的乘法次数,实验结果表明其速度优于现有技术。
本文探讨了高维稀疏计数数据的主题建模,比较了多种算法,强调超参数优化对性能的影响。提出了一种新型主题模型和推理方法,利用预训练语言模型改善短文本建模,显著提升了主题质量和聚类效果。
完成下面两步后,将自动完成登录并继续当前操作。