用于粒子流重建的可扩展神经网络模型与万亿级数据集
原文中文,约400字,阅读约需1分钟。发表于: 。研究了可扩展的机器学习模型,用于基于高粒度探测器模拟的高能电子 - 正电子碰撞的完全事件重建。比较了图神经网络和基于核的变压器,并证明两者在实现逼真的粒子流重建时,同时避免了二次内存分配和计算成本。展示了在超级计算机上进行的超参数调整显著改善了模型的物理性能。还展示了所得模型在支持 Nvidia、AMD 和 Intel Habana...
该研究比较了图神经网络和基于核的变压器在高能电子-正电子碰撞事件重建中的应用,证明两者都能够实现逼真的粒子流重建,同时避免了二次内存分配和计算成本。超参数调整显著改善了模型的物理性能,并展示了该模型在多种硬件处理器上具有高度可移植性。数据集和软件已按照FAIR原则发布,可用于重现研究。