Hive
原文中文,约48200字,阅读约需115分钟。发表于: 。Apache Hive 是一个用于大数据处理的开源数据仓库工具,最初由Facebook开发并于2010年贡献给Apache软件基金会。它设计的主要目的是使数据分析人员能够通过类SQL语言(即HiveQL)在Hadoop分布式文件系统 (HDFS) 上执行大规模数据查询和分析。Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL...
本文介绍了Apache Hive的基本查询、RLIKE语句、UNION语句、SAMPLE快速采样、虚拟列、常用内置函数、数据清洗转换、数据统计、导入导出数据和权限管理等内容。