应用数学中工作流程和模型的 FAIR 文档化方向

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

现代科学发现需要跨多个计算设施进行多学科合作。MIDA是一种轻量级运行时多工作流集成数据分析方法,通过可观察性和适应性整合数据流,用于材料科学中的深度学习用例。在Summit超级计算机上,接近零开销地运行了高达100,000个任务。

🎯

关键要点

  • 现代大规模科学发现需要跨多个计算设施进行多学科合作,包括高性能计算和边缘到云的连续体。

  • 综合数据分析在科学发现中至关重要,特别是在人工智能时代。

  • 科学的异构性带来了挑战,如处理多个支持工具和高效的 HPC 执行。

  • MIDA是一种轻量级运行时多工作流集成数据分析方法,定义了数据可观察性策略和适应性方法。

  • MIDA通过可观察性整合数据流,无需仪器,将数据整合到统一数据库中。

  • 实验展示了从Dask和MLFlow集成数据的端到端多工作流分析,用于材料科学中的深度学习。

  • 在Summit超级计算机上,接近零开销地运行了高达100,000个任务。

➡️

继续阅读