具有潜在特征层次的高维数据的树-瓦瑟斯坦距离
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究提出了一种新的树-瓦瑟斯坦距离(TWD),有效解决高维数据样本间的距离计算问题,适用于具有潜在特征层次的数据。该方法通过扩散几何在文档-词汇和单细胞RNA测序数据集上表现优异。
🎯
关键要点
- 本研究提出了一种新的树-瓦瑟斯坦距离(TWD)。
- 该方法有效解决高维数据样本间的距离计算问题。
- TWD特别适用于具有潜在特征层次的数据。
- 通过扩散几何将特征嵌入多尺度超曲率空间。
- 建立超曲率嵌入与树之间的类比。
- 实验证明该距离计算高效且可扩展。
- 在文档-词汇和单细胞RNA测序数据集上表现优异。
➡️