将多轴高斯图模型扩展适用于数百万样本和特征
原文中文,约300字,阅读约需1分钟。发表于: 。高斯图模型可用于提取数据集特征之间的条件依赖关系,本论文提出了一种无需假设独立性且具有可伸缩性的方法,同时保持了先前工作的灵活性和易解释性。
GraphScale是一个用于存储和处理大型图数据的统一框架,通过解耦计算和存储,实现了数据获取和计算的异步重叠,提高了分布式训练的效率。在GNNs和节点嵌入的训练中,GraphScale表现优异,训练时间至少减少了40%,且没有性能损失。GraphScale已在TikTok上生产部署,可用于高效学习大型图。