离散分布的谱聚类
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一个基于谱聚类和分布相似度度量(如最大均值差异和 Wasserstein 距离)的简单而有效的框架用于离散分布聚类,并通过使用线性最优输运在大规模数据集上高效地构建相似矩阵,得到了较高的聚类准确率和计算效率。
本文提出了一种新的方法来解决多层次聚类问题,利用离散概率测度空间上的联合优化方案,并通过Wasserstein距离度量发现组间的分组模式。该方法具有快速的优化算法和一致性性质,并展示了其在合成和真实数据上的灵活性和可扩展性。