BriefGPT - AI 论文速递 ·

基于在线动态嵌入预测的减少陈旧性的分布式 GNN 训练

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本文提出了一种在分布式设置下使用节点采样的图神经网络的小批量训练与推断的方案，通过分析多跳邻域采样时的节点包含概率（VIP），提出基于 VIP 驱动的缓存策略，减少通信量，保持本地训练效率和可扩展性，并在常用节点特征上用 GPU 存储。实验结果表明，使用 SALIENT++ 在 8 个单 GPU 机器上训练 3 层 GraphSAGE 模型的速度比使用 SALIENT 在 1 个单 GPU 机器上快 7.1 倍，在 8 个单 GPU 机器上比使用 DistDGL 快 12.7 倍。

🎯

关键要点

提出了一种在分布式设置下使用节点采样的图神经网络的小批量训练与推断方案。
通过分析多跳邻域采样时的节点包含概率（VIP），提出基于 VIP 驱动的缓存策略。
该策略显著减少通信量，保持本地训练效率和可扩展性。
在常用节点特征上使用 GPU 存储。
实验结果显示，使用 SALIENT++ 在 8 个单 GPU 机器上训练 3 层 GraphSAGE 模型的速度比使用 SALIENT 快 7.1 倍。
在 8 个单 GPU 机器上，使用 SALIENT++ 比使用 DistDGL 快 12.7 倍。

🏷️

继续阅读

开源模型Ornith-1.0发布：让AI自己写训练攻略，9B小模型干翻31B
Ornith-1.0是一个开源AI模型，首次实现自我优化训练策略，通过强化学习提升学习效率。尽管参数较小，Ornith-1.0在测试中表现优异，超越许多大...
为 AI 数据流动而生：Fluxon 分布式键值缓存、RPC、消息队列与文件对象缓存加速层
Fluxon 是一个专为 AI 训练与推理设计的数据面加速系统，整合了分布式键值缓存、RPC、消息队列和文件对象缓存，解决了传统系统在数据流动、资源治理和...
StreamVX 和 SyncWords 合作开发用于直播和 OTT 的多语言 AI 字幕管道
StreamVX 和 SyncWords 达成技术合作，旨在可靠地集成 DVB-TTML 字幕。两家公司表示，随着直播主播越来越依赖人工智能字幕来扩大多...
ZoomMate 如何取代 Zoom 的定制 AI 助手
ZoomMate 及其 AI 生产力套件于 6 月初首次亮相，引发了人们对 Zoom 人工智能产品线的疑问，其中最主要的问题是：ZoomMate 与 Zo...
每个成长型企业都应该了解的 VoIP 安全风险
VoIP系统如今已成为日常业务基础设施的一部分。它们通过基于互联网的通话工具连接员工、客户、销售团队、技术支持部门、远程办公人员和供应商。随着使用量的增长...
沃达丰、ARD 和 DHBW 测试量子加密电视传输
德国沃达丰公司、德国公共广播公司 ARD 在其地区附属公司 SWR 和巴登符腾堡双元制应用技术大学 (DHBW) 的领导下，成功测试了量子加密电视流的传输...

内容提要

关键要点

标签

继续阅读