0
点赞
收藏
分享

微信扫一扫

服务异步通讯之 SpringAMQP【微服务】

吓死我了_1799 2024-01-25 阅读 12

       最近学习hive 时候,在做一个实操案例,具体大概是这样子的:

       我在dataGip里建了一个表,然后在hadoop集群创建一个文本文件里面存储了数据库表的数据信息,然后把他上传到hdfs后,dataGrip那个表也同步了我上传到hdfs数据信息,这一下子让我有点懵了,为什么可以实现同步呢?

      首先hive的定义为,基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,Hive中每张表的数据存储在HDFS

 

      另外对于hiveserver2访问

       这里关键在于理解真正的表数据信息在hdfs,而在dataGrip的表实际上是根据matestored 元数据以及hdfs数据信息映射到数据库得到的一张张表。

而且datagrip实际上根据hdfs路径找到对应的数据信息的

        因此回到我上面讲的实操案例,具体流程:

举报

相关推荐

0 条评论