面向数据驱动的混合高性能计算与机器学习工作流应用的可扩展运行时架构

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

本研究提出了一种可扩展的运行时架构,旨在提高传统高性能计算与现代机器学习结合的执行效率。该架构增强了RADICAL-Pilot,支持AI驱动的高性能计算工作流,有效管理并行机器学习模型的执行,为大规模数据驱动工作流应用奠定基础。

🎯

关键要点

  • 本研究提出了一种可扩展的运行时架构,旨在提高传统高性能计算与现代机器学习结合的执行效率。
  • 该架构增强了RADICAL-Pilot,支持AI驱动的高性能计算工作流。
  • 实验结果表明,该方法能够有效管理本地和远程HPC/cloud资源上的并行机器学习模型执行。
  • 该架构为在领先级HPC平台上大规模执行数据驱动工作流应用奠定了基础。
➡️

继续阅读