CDFGNN:一种基于缓存的分布式全批量图神经网络训练的系统设计与通信减少
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
CATGNN是一个成本效益高且可扩展的分布式GNN训练系统,使用名为SPRING的新型流式分区算法。验证了CATGNN与SPRING在16个开放数据集上的正确性和有效性,证明CATGNN能够处理最大的公开可用数据集,并在平均复制因子上优于最先进的分区算法50%。
🎯
关键要点
-
CATGNN 是一个成本效益高且可扩展的分布式 GNN 训练系统。
-
CATGNN 专注于在有限计算资源下扩展 GNN 训练到十亿规模或更大规模的图。
-
CATGNN 提出了名为 SPRING 的新型流式分区算法。
-
在 16 个开放数据集上验证了 CATGNN 与 SPRING 的正确性和有效性。
-
CATGNN 能够处理最大的公开可用数据集。
-
CATGNN 在平均复制因子上显著优于最先进的分区算法 50%。
➡️