本研究提出了一种无需参数学习的简单聚类方法SASE,解决了属性图聚类方法在大规模图上的高计算成本和内存使用问题。SASE通过平滑节点特征、使用随机傅里叶特征进行可扩展谱聚类以及自适应选择顺序,有效捕捉全局聚类结构,并在图大小上表现出线性时间和空间复杂度。实验证明,SASE在处理大规模数据集时显著提高了准确率和速度。
提出了一种统一的GNN稀疏化框架,剪枝图邻接矩阵和模型权重,加速大规模图上的GNN推理。通过迭代应用UFS联合鉴定,GLT能在不影响预测性能的前提下实现小和大规模图数据集上的MACS节约。
介绍了一种新的基于降维的图形可视化方法t-SGNE,可支持更大规模的图,结合SPLEE算法可在5分钟内对具有300K节点和1M边缘的图进行可视化,可视化质量提升约10%。
该论文介绍了基于TPUs上运行的完整张量程序的性能预测数据集TpuGraphs,该数据集提供了大规模图的图级预测任务,涉及规模可比较的图属性预测数据集的25倍的图,以及平均比现有的机器学习程序性能预测数据集大770倍的大型图。这带来了从可伸缩性、训练效率到模型质量等方面的新挑战。
完成下面两步后,将自动完成登录并继续当前操作。