本文介绍了如何使用Apache Spark高效导出深层嵌套数据文件,保留分区文件夹。通过input_file_name()、regexp_extract()和partitionBy() API,可以提取并分区保存年份、月份、日期和小时等辅助列。
完成下面两步后,将自动完成登录并继续当前操作。