Hive笔记-6-CFANZ编程社区

hive (default)> select count(*) cnt from emp;

hive sql执行过程：

count不仅可以传一个 * 还可以传一个(字段)

hive (default)> select max(sal) max_sal from emp;

hive sql执行过程：

hive (default)> select min(sal) min_sal from emp;

hive sql执行过程：

hive (default)> select sum(sal) sum_sal from emp;

hive sql执行过程：

hive (default)> select avg(sal) avg_sal from emp;

hive sql执行过程：

Group By语句通常会和聚合函数一起使用，按照一个或者多个列队结果进行分组，然后对每个组执行聚合操作。

把job分组后查看

select count(*) from emp group by job

结果:

看起来有点不太对劲,再改一下:

在count(*)前面加个job

注意:

hive (default)> 
select 
    t.deptno, 
    avg(t.sal) avg_sal 
from emp t 
group by t.deptno;

hive sql执行过程：

（2）计算emp每个部门中每个岗位的最高薪水。

hive (default)>
select 
    t.deptno, 
    t.job, 
    max(t.sal) max_sal 
from emp t 
group by t.deptno, t.job;

hive sql执行过程：

找这张表里人数大于等于2的:

输入代码:

得到输出结果:

但是当我不想要嵌套子查询时:

那我们就用having:

hive (default)> 
select 
    deptno, 
    avg(sal) 
from emp 
group by deptno;

hive sql执行过程：

hive (default)>
select 
    deptno, 
    avg(sal) avg_sal 
from emp 
group by deptno  
having avg_sal > 2000;

hive sql执行过程：