本研究提出了一种新方法评估聚类稳健性,解决聚类数量选择的问题。通过分析30,000个政治推特短文本,引入比例稳定性指标,揭示不同聚类分辨率下的稳定性,并通过桑基图可视化帮助理解数据集特性。结果显示,聚类数量选择涉及信息量与复杂性的权衡。
完成下面两步后,将自动完成登录并继续当前操作。