DiskGNN:为离核 GNN 训练提供 I/O 效率和模型准确性的桥接
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
CATGNN是一种成本效益高且可扩展的分布式GNN训练系统,使用名为SPRING的新型流式分区算法。在16个开放数据集上验证了CATGNN与SPRING的正确性和有效性,尤其在处理最大的公开可用数据集方面表现优异。
🎯
关键要点
- CATGNN 是一个成本效益高且可扩展的分布式 GNN 训练系统。
- CATGNN 专注于在有限计算资源下扩展 GNN 训练到十亿规模或更大规模的图。
- CATGNN 提出了名为 SPRING 的新型流式分区算法用于分布式 GNN 训练。
- 在 16 个开放数据集上验证了 CATGNN 与 SPRING 的正确性和有效性。
- CATGNN 在处理最大的公开可用数据集方面表现优异。
- CATGNN 在平均复制因子上显著优于最先进的分区算法 50%。
🏷️
标签
➡️