小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
使用Apache Hive在不到5秒的时间内处理2000万条记录

本文介绍了如何在Hadoop环境中启动Apache Hive,包括Hive的架构、配置和优化。Hive通过MapReduce执行SQL查询,主要组件有Driver、Hive Clients、MetaStore和Hadoop。文章还展示了如何使用Docker Compose配置Hadoop和Hive,并比较了CSV、Parquet和ORC格式的查询性能,强调了分区和优化策略的重要性。

使用Apache Hive在不到5秒的时间内处理2000万条记录

DEV Community
DEV Community · 2024-11-02T20:43:55Z
大规模数据:揭示分布式系统中Hive与Cassandra的秘密

分布式计算通过将数据负载分散到多个服务器,提高了性能和容错能力。Apache Hive适合数据仓库,而Cassandra则专注于高可用性和可扩展性。这些技术在处理海量数据时提供了高效解决方案,推动了数据驱动的决策与创新。

大规模数据:揭示分布式系统中Hive与Cassandra的秘密

DEV Community
DEV Community · 2024-10-27T09:34:18Z
Hive

本文介绍了Apache Hive的基本查询、RLIKE语句、UNION语句、SAMPLE快速采样、虚拟列、常用内置函数、数据清洗转换、数据统计、导入导出数据和权限管理等内容。

Hive

Anjhon’s Blog
Anjhon’s Blog · 2024-07-15T16:00:00Z
Apache软件基金会宣布发布Apache® Hive 4.0

Apache软件基金会于2024年4月30日发布了Apache Hive 4.0。该版本增强了性能和安全性,支持Kerberos认证,并与Apache Ranger和Atlas集成。Hive Metastore作为元数据中心,促进了现代数据生态系统的访问。

Apache软件基金会宣布发布Apache® Hive 4.0

The Apache Software Foundation Blog
The Apache Software Foundation Blog · 2024-04-30T13:00:00Z
Databend 本周动态 #108

Databend是一个云数据仓库,用于大规模分析需求。它支持多个目录,包括Apache Iceberg和Apache Hive。最新的改进包括引入json_pretty函数,改进了Inner Join的性能,并在HTTP查询界面中增加了更多指标。Databend计划引入SQLsmith进行模糊测试。您可以查看更新日志了解最新动态。

Databend 本周动态 #108

Databend Blog
Databend Blog · 2023-08-27T00:00:00Z
Apache Hive 学习笔记

本文介绍了Apache Hive的基本概念和安装步骤,包括Hive与MySQL的配置、元数据初始化及常用SQL语法。Hive能够将数据文件映射为表,并支持SQL查询。安装过程中需卸载MariaDB,安装MySQL并配置Hive环境。文中还详细说明了Hive的使用方法,包括创建数据库、表及数据操作等。

Apache Hive 学习笔记

Dr3@m's Blog
Dr3@m's Blog · 2022-01-06T08:41:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码