具有潜在特征层次的高维数据的树-瓦瑟斯坦距离

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本研究提出了一种新的树-瓦瑟斯坦距离(TWD),有效解决高维数据样本间的距离计算问题,适用于具有潜在特征层次的数据。该方法通过扩散几何在文档-词汇和单细胞RNA测序数据集上表现优异。

🎯

关键要点

  • 本研究提出了一种新的树-瓦瑟斯坦距离(TWD)。
  • 该方法有效解决高维数据样本间的距离计算问题。
  • TWD特别适用于具有潜在特征层次的数据。
  • 通过扩散几何将特征嵌入多尺度超曲率空间。
  • 建立超曲率嵌入与树之间的类比。
  • 实验证明该距离计算高效且可扩展。
  • 在文档-词汇和单细胞RNA测序数据集上表现优异。
➡️

继续阅读