应用数学中工作流程和模型的 FAIR 文档化方向
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
现代科学发现需要跨多个计算设施进行多学科合作。MIDA是一种轻量级运行时多工作流集成数据分析方法,通过可观察性和适应性整合数据流,用于材料科学中的深度学习用例。在Summit超级计算机上,接近零开销地运行了高达100,000个任务。
🎯
关键要点
-
现代大规模科学发现需要跨多个计算设施进行多学科合作,包括高性能计算和边缘到云的连续体。
-
综合数据分析在科学发现中至关重要,特别是在人工智能时代。
-
科学的异构性带来了挑战,如处理多个支持工具和高效的 HPC 执行。
-
MIDA是一种轻量级运行时多工作流集成数据分析方法,定义了数据可观察性策略和适应性方法。
-
MIDA通过可观察性整合数据流,无需仪器,将数据整合到统一数据库中。
-
实验展示了从Dask和MLFlow集成数据的端到端多工作流分析,用于材料科学中的深度学习。
-
在Summit超级计算机上,接近零开销地运行了高达100,000个任务。
➡️