0
点赞
收藏
分享

微信扫一扫

Hive的常见压缩格式(ORC,Parquet,Sequencefile,RCfile,Avro)的区别


读写查询性能测试:
Hive的常见压缩格式(ORC,Parquet,Sequencefile,RCfile,Avro)的区别_设计理念
Hive的常见压缩格式(ORC,Parquet,Sequencefile,RCfile,Avro)的区别_数据_02

TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的;并且SEQUENCEFILE是存储为二进制文件

ORC和PARQUET是基于列式存储的

行列混合存储的RCFile,该存储结构遵循的是“先水平划分,再垂直划分”的设计理念。先将数据按行水平划分为行组,这样一行的数据就可以保证存储在同一个集群节点;然后在对行进行垂直划分,RCFile全称Record Columnar File,列式记录文件,是一种类似于SequenceFile的键值对(Key/Value Pairs)数据文件,

举报

相关推荐

0 条评论