对于hbase的预分区,首先预估源数据的rowkey前缀规则,一般推荐是region server的个数,保证rowkey平均分配,如rowkey客户id,推荐将客户id反转,分区规则 0-10
create 't1', 'f1', SPLITS => ['0', '1', '2', '3','4','5','6','7','8','9']
可以观察到其start key 和 end key的分布
写入两条数据验证一下
可以看到写请求变化
注意: truncate操作会丢失所有预分区
微信扫一扫
对于hbase的预分区,首先预估源数据的rowkey前缀规则,一般推荐是region server的个数,保证rowkey平均分配,如rowkey客户id,推荐将客户id反转,分区规则 0-10
create 't1', 'f1', SPLITS => ['0', '1', '2', '3','4','5','6','7','8','9']
可以观察到其start key 和 end key的分布
写入两条数据验证一下
可以看到写请求变化
注意: truncate操作会丢失所有预分区
相关推荐