Databricks ·

开放湖仓的下一个时代：Databricks上Apache Iceberg™ v3公测

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

Databricks的Iceberg v3进入公测，支持增量数据处理和半结构化数据分析，简化数据管道。新特性包括行血统、删除向量和VARIANT类型，提升性能，支持多引擎互操作性，优化数据治理，降低维护成本。

🎯

❓

Iceberg v3引入了行血统、删除向量和VARIANT类型，支持增量数据处理和半结构化数据分析，提升性能和互操作性。

行血统帮助快速识别数据变化，而删除向量允许逻辑删除行而无需重写数据文件，从而使数据操作性能提高至传统方法的10倍。

VARIANT类型允许半结构化数据与关系型列共存，简化数据处理，无需进行模式迁移，支持直接查询。

Unity Catalog实现跨目录和引擎的互操作性，支持细粒度访问控制，简化数据治理和监控。

Databricks通过UniForm实现Delta Lake与Iceberg的互操作性，允许在Delta Lake中写入数据并在Iceberg中读取，消除数据复制的需要。

Databricks结合预测优化、自动液体聚类和Unity Catalog，实现性能和布局优化，减少操作开销，提升数据可移植性。

🏷️

MacBook Neo是近年来Windows最好的机遇
微软将加速改善Windows 11，以应对苹果MacBook Neo的竞争，计划提升性能和用户体验，包括内存效率、搜索功能和任务栏位置等，旨在恢复用户信任。
Apache软件基金会欢迎45名新成员
ASF在2026年3月5日的年会上选举了包括C. Scott Andreas在内的42名新成员。ASF成立于1999年，是一个501(c)(3)的会员公司...
Zalando如何在Databricks上构建统一的数据基础，以支持人工智能和分析
仪表板在日常问题解答中至关重要，但业务速度常超出标准报告的能力，导致用户需构建新仪表板以应对新问题，从而产生时间延迟和冗余。
Apache项目开发者提交代码时不慎泄露GitHub令牌但并非AI造成的问题
Apache 服务器开发者因操作失误泄露 GitHub 令牌，GitHub 及时检测并吊销该令牌，通知开发者更换，从而降低安全风险。
Instagram 现在允许用户编辑自己的评论
Instagram允许用户在发布评论后15分钟内编辑，旨在减少错误，已于3月开始测试。
PyTorch基金会通过Safetensors、ExecuTorch和Helion扩展AI技术栈
Hugging Face于2022年推出了Safetensors，这是一种广泛应用于开源机器学习的张量序列化格式。作为PyTorch的一部分，Safete...