目录 什么是数据倾斜问题 SQL如何解决数据倾斜问题 having和where的区别 在union和join的区别 举例说明 使用union 使用join count(*)、count(字段)和count(distinct字段)的区别 什么是数据倾斜问题 数据倾斜问题是指在数据分布不均匀的情况下,某些特定的数据分区或键值会出现过多的数据,导致计算负载不均衡,可能会导致一些计算资源长时间处于高负载状态,影响查询性能和效率。 SQL如何解决数据倾斜问题 数据预处理:在数据导入之前,对数据进行预处理,通过一些技术手段将数据进行分散、均匀化,减少数据倾斜的可能性。 数据重分布:对于已经存在数据倾斜的表