DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

DuckDB的WebAssembly客户端允许在浏览器中查询Iceberg数据集

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

DuckDB最近推出了与Iceberg REST Catalogs的无服务器端到端交互,用户无需基础设施设置即可在浏览器中查询、读取和写入Iceberg表。该功能基于DuckDB-Wasm,确保浏览器和本地版本执行相同逻辑,用户可通过演示访问自己的S3表,所有计算在浏览器本地运行。

🎯

关键要点

  • DuckDB最近推出了与Iceberg REST Catalogs的无服务器端到端交互,用户无需基础设施设置即可在浏览器中查询、读取和写入Iceberg表。

  • 该功能基于DuckDB-Wasm,确保浏览器和本地版本执行相同逻辑。

  • DuckDB团队重新设计了HTTP交互,实施了JavaScript网络包装器,并通过公共接口路由所有Iceberg网络请求。

  • 与Iceberg REST Catalog交互需要通过HTTP(S)与REST API通信,读取和写入对象存储中的avro和parquet文件,以及进行身份验证。

  • DuckDB是一个开源的分析数据库管理系统,旨在快速查询大型数据集,常被称为“分析的SQLite”。

  • DuckDB-Wasm支持加载扩展,并展示了一个与Amazon S3表配合使用的表可视化演示。

  • DuckDB早在2025年就增加了对Apache Iceberg REST Catalogs的支持,允许用户连接到Amazon S3表和Amazon SageMaker Lakehouse。

  • 用户可以使用演示替换自己的S3表桶ARN和凭证,所有计算在浏览器中本地运行。

  • 敏感数据不会被处理或发送到duckdb.org,所有计算都是在用户的浏览器中进行的。

  • DuckDB在AWS re:Invent 2025会议上展示了从浏览器查询S3表的演示。

延伸问答

DuckDB的WebAssembly客户端有什么新功能?

DuckDB的WebAssembly客户端允许用户在浏览器中无服务器地查询、读取和写入Iceberg表,无需基础设施设置。

如何在浏览器中使用DuckDB查询Iceberg数据集?

用户可以通过DuckDB的演示替换自己的S3表桶ARN和凭证,所有计算在浏览器中本地运行。

DuckDB-Wasm的作用是什么?

DuckDB-Wasm是DuckDB的WebAssembly版本,确保浏览器和本地版本执行相同逻辑,并支持加载扩展。

DuckDB如何处理与Iceberg REST Catalog的交互?

DuckDB重新设计了HTTP交互,实施了JavaScript网络包装器,并通过公共接口路由所有Iceberg网络请求。

DuckDB支持哪些数据格式?

DuckDB支持读取和写入avro和parquet文件,适用于对象存储中的数据。

DuckDB在AWS re:Invent 2025会议上展示了什么?

DuckDB在会议上展示了从浏览器查询S3表的演示,展示了与Iceberg表的交互能力。

➡️

继续阅读