BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 -

高性能计算系统上机器学习应用中的 I/O:全方位调查

通过对高性能计算系统中机器学习应用的 I/O 进行研究,本文在 2019 年至 2024 年的 6 年时间窗口内,概述了机器学习的常见阶段,评估了可用的分析工具和基准测试,探讨了机器学习训练过程中遇到的 I/O 模式,研究了现代机器学习框架中使用的 I/O 优化方法并提出了未来的研究方向和需要进一步探索的问题。

大规模数据集上的机器学习训练是昂贵和耗时的,处理器中心化系统面临性能下降和高能耗问题。内存中处理是解决数据移动瓶颈的解决方案。研究发现通用PIM体系结构可以替代CPU和GPU,但不能实现线性扩展。

内存中处理 处理器中心化系统 大规模数据集 机器学习 机器学习训练 通用PIM体系结构

相关推荐 去reddit讨论