内容提要
本教程介绍了如何从不同格式和来源加载数据集到Google BigQuery。通过上传CSV文件、JSON文件、从Google Cloud Storage加载数据集和从Google Sheets导入数据集的四种不同方式来加载数据。教程以加载描述亚洲菜肴的数据为例。首先创建一个BigQuery表,然后选择要上传的文件并自动检测模式。最后,通过Google Drive文件系统或Google Sheets导入数据。
关键要点
-
本教程介绍了如何将数据集从不同格式和来源加载到Google BigQuery。
-
需要在Google Cloud Platform上注册并创建项目,启用BigQuery API。
-
加载数据的四种方式:从CSV文件上传、从JSON文件上传、从Google Cloud Storage加载、从Google Sheets导入。
-
从CSV文件加载数据时,需创建BigQuery数据集并指定表名,启用自动检测模式。
-
从JSON文件加载数据时,确保每个JSON对象单独一行,避免使用数组。
-
从Google Cloud Storage加载数据时,需要指定存储桶,并确保已设置计费信息。
-
从Google Sheets导入数据时,需复制基础URL并指定文件格式为Google Sheet,启用自动模式检测。
-
BigQuery不支持对Google Sheets创建的表进行数据预览,需通过查询访问数据。
-
接下来将学习如何在BigQuery中执行查询和使用SQL语法。
延伸问答
如何将CSV文件导入BigQuery?
在BigQuery Studio中,点击'+ Add',选择'Local file',然后上传CSV文件,创建数据集并指定表名,确保启用自动检测模式,最后点击'CREATE TABLE'。
从Google Cloud Storage加载数据到BigQuery需要注意什么?
需要指定存储桶,并确保已设置计费信息,支持定期批量加载和过程调度。
如何从Google Sheets导入数据到BigQuery?
选择从'Drive'上传,复制基础URL到URI字段,指定文件格式为Google Sheet,启用自动模式检测,最后命名表格并完成导入。
导入JSON文件时需要遵循什么格式?
确保每个JSON对象单独一行,避免使用数组格式,以免上传时出错。
在BigQuery中创建数据集的步骤是什么?
在BigQuery Studio中,点击'+ Add',选择'Local file',然后创建数据集并指定名称,最后添加表格。
BigQuery支持哪些数据加载方式?
BigQuery支持从CSV文件、JSON文件、Google Cloud Storage和Google Sheets四种方式加载数据。