本研究探讨短文本数据聚类中的信息性与可解释性平衡,发现高斯混合模型能有效提高语义密度,但聚类数量过多会降低可解释性,建议聚类数量控制在16-22个之间。
本研究提出了一种名为AEye的可视化工具,通过对比训练的模型生成高维表示,实现数据的聚类和组织,提高了数据集的探索效率。
完成下面两步后,将自动完成登录并继续当前操作。