0
点赞
收藏
分享

微信扫一扫

hbase基本概念

  今天学习了habse的基本概念:

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的​​分布式存储系统​​”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。 

HBase – Hadoop Database,是一个高​​可靠​​​性、高性能、面向列、可伸缩的​​分布式存储系统​​​,利用HBase技术可在廉价PC Server上搭建起大规模​​结构​​​化​​存储​​集群。

与FUJITSU Cliq等商用大数据产品不同,HBase是Google Bigtable的开源实现,​​类似​​​Google Bigtable利用GFS作为其文件​​存储​​​系统,HBase利用Hadoop HDFS作为其​​文件​​​存储​​系统​​​;Google运行MapReduce来处理Bigtable中的海量​​数据​​​,HBase同样利用Hadoop MapReduce来处理HBase中的​​海量​​数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。 [1] 

hbase基本概念_结构化

上图描述Hadoop EcoSystem中的各层系统。其中,HBase位于结构化​​存储​​层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得​​传统数据库​​数据向HBase中迁移变的非常方便。


举报

相关推荐

0 条评论