Databricks ·

宣布无服务器和标准集群上分布式机器学习的公共预览

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

Databricks推出Apache Spark MLlib和Optuna的公共预览，支持无服务器和标准集群的分布式机器学习。此更新简化了多用户协作，增强了安全性和治理，允许团队在不同计算环境中无缝扩展机器学习工作负载。与NVIDIA的合作实现了GPU加速，显著提高性能并降低成本。

🎯

🔎

Databricks的无服务器计算模式使得团队能够在没有基础设施管理负担的情况下，专注于机器学习的开发和应用。这种模式不仅降低了技术门槛，还提高了资源的利用效率，适合快速迭代和实验的场景。

随着多用户协作的增强，数据安全和治理变得尤为重要。Databricks的Lakeguard技术提供了细粒度的访问控制，确保在共享环境中，数据和工作负载的安全性得到保障。这对于企业在合规性和数据保护方面至关重要。

与NVIDIA的合作使得Databricks能够实现GPU加速，显著提升了机器学习任务的性能。企业可以在不改变代码的情况下，享受高达9倍的性能提升和80%的成本降低，这为大规模数据处理和AI应用提供了新的可能性。

❓

Databricks的公共预览支持Apache Spark MLlib和Optuna。

无服务器和标准集群的分布式机器学习简化了多用户协作，增强了安全性和治理，允许团队无缝扩展工作负载。

Databricks与NVIDIA的合作实现了GPU加速，显著提高了性能并降低了成本。

Lakeguard技术提供细粒度访问控制和多用户隔离，确保数据和工作负载在同一治理层下受到保护。

更新允许团队在不同计算环境中无缝扩展机器学习工作负载，提升了统一体验。

企业可以实现无基础设施烦恼的机器学习扩展，安全高效地从业务数据中获取洞察。

🏷️