华为云官方博客 ·

对接HiveMetaStore，拥抱开源大数据

💡 原文中文，约7600字，阅读约需18分钟。

📝

内容提要

本文介绍了GaussDB(DWS)与HiveMetaStore的对接配置和指导，通过创建external schema实现直接查询和插入Hive/Spark表，无需担心表定义变化。对接流程包括创建Server、external schema和SQL查询。准备环境后，在Hive端创建表并导入数据，然后创建外部服务器和external schema，最后执行数据导入和查询操作。

🎯

关键要点

本文介绍了GaussDB(DWS)与HiveMetaStore的对接配置和指导。
通过创建external schema实现直接查询和插入Hive/Spark表，无需担心表定义变化。
HiveMetaStore是Apache Hive的元数据存储库，管理Hive/Spark表的元数据信息。
external schema用于与HiveMetaStore建立连接，获取表对象元数据。
创建external schema时需指定连接的各个属性值，且不支持创建表对象。
对接流程包括创建Server、external schema和SQL查询。
准备环境需确保DWS和MRS集群在同一网络内，并获取AK和SK。
在Hive端创建表并导入数据后，创建外部服务器和external schema。
执行数据导入和查询操作，确保数据在Hive和DWS之间的流动。
本文总结了GaussDB(DWS)对接HiveMetaStore的原理和方式。

❓

延伸问答

GaussDB(DWS)如何与HiveMetaStore对接？

GaussDB(DWS)通过创建external schema与HiveMetaStore对接，实现直接查询和插入Hive/Spark表。

什么是HiveMetaStore，它的作用是什么？

HiveMetaStore是Apache Hive的元数据存储库，管理Hive/Spark表的元数据信息，提供查询和分析服务。

创建external schema时需要注意哪些事项？

创建external schema时需指定连接属性值，且不支持创建表对象，表对象需在Hive或Spark中创建。

在对接过程中，如何确保DWS和MRS集群的网络互通？

需确保DWS和MRS集群在同一网络内，并获取AK和SK以便进行连接。

如何在Hive端创建需要对接的表？

在Hive客户端中执行SQL语句创建数据库和表，并导入数据。

执行数据导入时，如何从Hive表导入到DWS表？

使用INSERT INTO语句从Hive表导入数据到DWS表，确保表结构一致。

🏷️