利用人工智能引导Exascale工作流的Colmena
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
现代科学发现需要多学科合作,包括HPC机器和边缘到云的连续体。MIDA是一种轻量级运行时多工作流集成数据分析方法,用于材料科学中的深度学习用例。在Summit超级计算机上,高达100,000个任务可以接近零开销地运行。
🎯
关键要点
- 现代大规模科学发现需要跨多个计算设施进行多学科合作,包括高性能计算(HPC)机器和边缘到云的连续体。
- 综合数据分析在科学发现中起着至关重要的作用,特别是在人工智能时代。
- 科学的异构性带来了挑战,如处理多个支持工具、跨设施环境和高效的HPC执行。
- MIDA是一种轻量级运行时多工作流集成数据分析方法,定义了数据可观察性策略和适应性方法。
- MIDA通过可观察性整合领域、溯源和遥测数据到一个统一的数据库中,支持用户调节查询。
- 实验展示了从Dask和MLFlow集成数据的端到端多工作流分析,用于材料科学中的真实分布式深度学习用例。
- 在Summit超级计算机上,能够在1,680个CPU核心上运行高达100,000个任务,接近零开销。
➡️