💡
原文英文,约2300词,阅读约需9分钟。
📝
内容提要
Unity Catalog Volumes现已在AWS、Azure和GCP上提供。它为数据和人工智能提供了统一的治理解决方案,允许团队对非表格数据进行目录、安全、管理和追踪。Volumes可用于创建涉及从各种文件类型加载数据的可扩展的人工智能和摄取应用程序。它支持不同的工具和库,简化对非结构化数据的访问,并为表格和非表格数据集提供统一的治理。Volumes还提供了跨人工智能应用程序的端到端血统,简化的开发者体验以及人工智能应用程序响应的流畅同步。
🎯
关键要点
- Unity Catalog Volumes现已在AWS、Azure和GCP上提供,提供统一的数据和人工智能治理解决方案。
- Volumes允许团队对非表格数据进行目录、安全、管理和追踪,支持多种数据格式。
- Volumes是Unity Catalog中的一种对象,旨在管理非表格数据,作为云对象存储位置中的逻辑存储单元。
- 使用Volumes可以创建多种基于文件的应用程序,简化对非结构化数据的访问。
- Volumes支持多种工具和库,包括Databricks工作区UI、Spark API、REST API等。
- AI应用程序通常处理大量非表格数据,Volumes为这些应用提供统一治理和端到端血统追踪。
- Volumes简化了开发者体验,支持与云对象存储API的无缝集成。
- 使用Volumes可以确保AI应用程序响应与源数据集的流畅同步。
- Volumes可用于加载半结构化和结构化数据,支持ETL任务。
- GA版本的Volumes包括多个新特性,如Delta Sharing、文件管理操作、作业文件到达触发器等。
- Volumes的UI已升级,支持多种文件管理操作,最大文件大小从2GB增加到5GB。
- 用户可以通过文档和最佳实践指南快速入门使用Volumes。
➡️