本文提出了一种基于 VIP 驱动的缓存策略,用于在分布式设置下使用节点采样的图神经网络的小批量训练与推断,显著减少通信量,保持本地训练效率和可扩展性。实验表明,使用 SALIENT++ 在 8 个单 GPU 机器上训练 3 层 GraphSAGE 模型的速度比使用 SALIENT 在 1 个单 GPU 机器上快 7.1 倍,在 8 个单 GPU 机器上比使用 DistDGL 快 12.7 倍。
本文提出了一种在分布式设置下使用节点采样的图神经网络的小批量训练与推断的方案,通过分析多跳邻域采样时的节点包含概率(VIP),提出基于 VIP 驱动的缓存策略,减少通信量,保持本地训练效率和可扩展性,并在常用节点特征上用 GPU 存储。实验结果表明,使用 SALIENT++ 在 8 个单 GPU 机器上训练 3 层 GraphSAGE 模型的速度比使用 SALIENT 在 1 个单 GPU 机器上快 7.1 倍,在 8 个单 GPU 机器上比使用 DistDGL 快 12.7 倍。
完成下面两步后,将自动完成登录并继续当前操作。