在 Hive 中,分区是一种组织数据的方式,允许你将表数据划分成更小的子集,以便更有效地管理和查询大型数据集。分区可以分为静态分区和动态分区,它们有不同的特点和用途。
1. 静态分区(Static Partitioning):
静态分区是在创建表时显式定义的分区方式。在静态分区中,你需要提前知道分区的取值范围,并在创建表时为每个分区分配一个目录。通常,静态分区用于对数据进行预先知道的划分,如按照年份、月份、地区等维度进行分区。
创建静态分区表:
CREATE TABLE my_table (
col1 STRING,
col2 INT
)
PARTITIONED BY (year INT, month INT