本文介绍了多个分布式图神经网络(GNN)训练框架,如DistGNN、BatchGNN、CoFree-GNN和CATGNN,强调它们在通信效率和训练速度上的显著提升。这些框架通过优化数据分区、批量生成和通信协议,实现了在大规模图上的高效训练,速度提升可达10倍以上,并有效解决了大图训练中的通信和内存问题。
提出了一种统一的GNN稀疏化框架,剪枝图邻接矩阵和模型权重,加速大规模图上的GNN推理。通过迭代应用UFS联合鉴定,GLT能在不影响预测性能的前提下实现小和大规模图数据集上的MACS节约。
介绍了一种新的基于降维的图形可视化方法t-SGNE,可支持更大规模的图,结合SPLEE算法可在5分钟内对具有300K节点和1M边缘的图进行可视化,可视化质量提升约10%。
该论文介绍了基于TPUs上运行的完整张量程序的性能预测数据集TpuGraphs,该数据集提供了大规模图的图级预测任务,涉及规模可比较的图属性预测数据集的25倍的图,以及平均比现有的机器学习程序性能预测数据集大770倍的大型图。这带来了从可伸缩性、训练效率到模型质量等方面的新挑战。
完成下面两步后,将自动完成登录并继续当前操作。