在 Azure 上的国家水模型

💡 原文英文,约400词,阅读约需2分钟。
📝

内容提要

作者在CIROH培训和开发者会议上展示了一个Jupyter Book,用于处理国家水模型数据。作者使用了JupyterHub和Kubernetes来运行工作坊,并使用dask-kubernetes的新Dask Operator来创建Dask集群。作者分享了将数据处理为云优化格式的代码,但由于没有操作管道来保持数据最新,云优化版本将被删除。作者认为需要采取措施使这些数据在云端更易于使用。

🎯

关键要点

  • 作者在CIROH培训和开发者会议上展示了一个Jupyter Book,用于处理国家水模型数据。

  • 使用JupyterHub和Kubernetes运行工作坊,利用dask-kubernetes的新Dask Operator创建Dask集群。

  • 创建了云优化格式的数据版本,但由于缺乏操作管道,云优化版本将被删除。

  • 作者认为需要采取措施使数据在云端更易于使用。

  • 会议的主要收获是需要使数据在云端更可用,可能需要某种Kerchunk索引。

  • 处理原始文件到云优化格式的管道仍然是一个挑战,数据本身的复杂性是主要原因。

  • 遇到文件损坏和国家水模型内部结构变化的问题,这些问题难以调试。

  • 维护操作管道是一个挑战,但希望未来能够解决。

🏷️

标签

➡️

继续阅读