数据库多表联合查询和分组查询-CFANZ编程社区

--------------------- 多表联合查询

理论依据：笛卡尔积
通过笛卡尔乘积，把两个或者多个表变为一个大表，里面包含了有效的，无效的记录（需要加条件进行过滤数据）

例如：查询学生的姓名，性别，以及学生所在院系的名称

SELECT * FROM student; -- 例如，王五，did=1001
SELECT * FROM DEPARTMENT WHERE did=1001;

SELECT * FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did;

SELECT sname,ssex,dname FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did;

例如：查询学生额姓名，年龄，这个学生选的课程名称，以及这门功课考试分数；

SELECT * FROM student,course,score WHERE student.sid = score.sid AND score.cid =course.cid;

SELECT sname,sage,cname,grade,STUDENT.sid FROM student,course,score
WHERE student.sid = score.sid AND score.cid =course.cid;

-- 如果实际工作中，表名多，且长，可以给表起别名：

SELECT sname,sage,cname,grade,s.sid FROM student s,course c,score s2
WHERE s.sid = s2.sid AND s2.cid =c.cid;

-- 总结

1、多表联合查询，你想要的数据在多个表中，得从多个表中查询获取，但是必须添加条件过滤，
如果不加条件，会出现大量错误数据。

2、条件，连接条件：先分析表跟表之间的关系，分析数据和数据之间的关系，把关系写成 SQL 语句：
多数情况下，表和表之间的关系是主外键关系，但是有特殊，有例外。

3、一个连接条件，只能连2个表，如果要连接N个表，至少需要 N-1 个连接条件；

==》语法

SELECT * FROM 表名1,表名2,表名3,... WHERE 1个或者多个连接条件 [AND 查询条件];

查询内容：全部信息、部分列（,间隔）；某一个表的全部列表名.* ;
如果查询涉及到比较多的表，表名过长，可以给表起别名：表名别名，注意查询内容，查询条件中明确定义列
都必须使用别名，明确定义列就是指明列名。

例如：查询学生额姓名，年龄，这个学生选的课程名称，以及这门功课考试分数，只保留乘积高于80的学生信息

SELECT sname,sage,cname,grade,s.sid
FROM student s,course c,score s2
WHERE s.sid = s2.sid AND s2.cid =c.cid AND grade>=80;
练习：

emp dept
1. 查询员工的姓名、岗位、薪水、以及员工所在部门的名称、地点

SELECT * FROM emp; -- deptno 部门编号
SELECT * FROM dept; -- deptno

关系：部门表的部门编号和员工表的部门编号一样 -- 》 SQL ： dept.deptno=emp.deptno

SELECT * FROM emp,dept WHERE dept.deptno=emp.deptno;

SELECT ename,job,sal,dname,loc FROM emp,dept WHERE dept.deptno=emp.deptno;

emp dept
2. 查询员工的所有列，以及员工所在部门的名称

SELECT emp.*,dname FROM emp,dept WHERE dept.deptno=emp.deptno;

3.查询学生的姓名、选的课程的名称,课时，成绩，所在院系名称

SELECT * FROM student,course,DEPARTMENT,score WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`

AND COURSE.cid=SCORE.cid;

SELECT sname,cname,chour,grade,dname FROM student,course,DEPARTMENT,score
WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`
AND COURSE.cid=SCORE.cid;

4. 查询计算机系的学生的姓名、选的课程的名称、课时、这门课考试的分数，以及这个学生所在系的名称

SELECT sname,cname,chour,grade,dname FROM student,course,DEPARTMENT,score
WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`
AND COURSE.cid=SCORE.cid AND dname IN('计算机','数学')

特殊情况：有的表关系不是主外键关系，并且列名也不一样，但是一样的可以写多表联合查询

SELECT * FROM salgrade ; -- 工资就级别表
SELECT * FROM emp; -- 职工表，sal 表示薪水

DESC salgrade;

例如：查询员工的姓名，岗位，薪水，以及薪资所在的级别。

关系：薪水>= 某级别最低工资并且薪水<=某级别最高工资，即薪水在某级别范围内 == 》薪资就属于该级别

变成 SQL 写出来： sal >=losal AND sal<=hisal 或者 sal BETWEEN losal AND hisal

SELECT * FROM emp,salgrade WHERE sal BETWEEN losal AND hisal;

-- 内连接，左连接，右连接（了解）

一、内连接 INNER JOIN,是多表联合查询的另外一种写法（笔试或者面试）

SELECT * FROM emp,dept WHERE dept.deptno=emp.deptno; -- 常规写法

SELECT * FROM emp INNER JOIN dept ON dept.deptno=emp.deptno; -- 内连接实现

二、左连接，右连接

左连接 LEFT JOIN : 将左表的内容全部显示，不管右表是否有对应的记录；

SELECT * FROM emp LEFT JOIN dept ON dept.deptno=emp.deptno;

右连接 RIGHT JOIN :将右表的内容全部显示，不管左表是否有对应的记录。

SELECT * FROM emp RIGHT JOIN dept ON dept.deptno=emp.deptno;

----------------------- 分组查询

分组查询主要是用来做统计的，一般都是按照某一个列进行统计
统计类型：求平均，求和，求最大，求最小等等

分组查询需要结合分组函数一起实现

COUNT(参数):统计查询语句返回的行数
MAX(参数):最大的
MIN(参数):最小的
SUM(参数):求和
AVG(参数):求平均

参数：一般都是列名，但是 COUNT() 的参数还可以是 * 或者是 1

注意：当参数是具体的列名的时候，函数会自动过滤掉列中的值是空值的情况，特别是count(),参数是列名，
就只统计列名非空情况，如果count(*),COUNT(1),即使空行，也会被统计。

例如：查询职工信息的数据，然后统计公司的员工人数，平均薪水，最高薪水，最低薪水。

SELECT * FROM emp;
SELECT COUNT(empno),COUNT(*),COUNT(1),AVG(sal),SUM(sal)/COUNT(empno),MAX(sal),MIN(sal)
FROM emp WHERE sal IS NOT NULL;

例如：统计部门编号为 10的员工总数，以及这个部门的平均薪水

SELECT * FROM emp WHERE deptno=10;

SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=10; -- 15

例如：统计每个部门的员工人数，以及该部门的平均薪水；按照部门编号进行分组统计部门的人数和部门的平均薪水

SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=20; -- 7

SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=30; -- 5

# 按照部门编号进行分组统计部门的人数和部门的平均薪水

按照 *** 分组： GROUP BY ***

SELECT COUNT(*),AVG(sal),deptno FROM emp GROUP BY deptno;

# 按照部门编号和岗位进行分组，统计每个部门每个岗位的人数及平均薪水

SELECT COUNT(*),AVG(sal),deptno,job FROM emp GROUP BY deptno,job;

==> 语法

关键词：
按照*** 进行分组： GROUP BY 列名,列名2,...
分组之后进行数据过滤： HAVING

SELECT 分组函数,被分组的列名 FROM 表名(1个或者多个表) [WHERE 连接条件] GROUP BY 1个或者多个列名 [HAVING 过滤条件]

# 按照部门编号和岗位进行分组，统计每个部门每个岗位的人数及平均薪水，只保留人数超过3个人的记录

SELECT COUNT(*),AVG(sal),deptno,job FROM emp GROUP BY deptno,job HAVING COUNT(*)>=3;

例如：按照部门名称及岗位进行分组统计，每个部门每个岗位的人数及平均薪水，并且保留人数超过3个记录。

SELECT COUNT(*),AVG(sal),dname,job
FROM emp,dept WHERE emp.`deptno`=dept.`deptno` GROUP BY dname,job HAVING COUNT(*)>=3 ;

练习：

1. 按照系别编号统计，每个系的学生人数，学生的平均年龄，学生最大年龄

SELECT * FROM STUDENT;
SELECT COUNT(*),AVG(sage),MAX(sage),did FROM STUDENT GROUP BY did;

SELECT COUNT(*),AVG(sage),MAX(sage),dname
FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did GROUP BY dname;

2. 按照性别去统计，统计每个性别的人数，性别最小年龄

SELECT COUNT(*),MIN(sage),ssex FROM student GROUP BY ssex;

3. 按照系别编号和性别一起去分组，统计每个系的男的多少人，女的多少人

SELECT COUNT(*),did,ssex FROM STUDENT GROUP BY did,ssex ORDER BY did DESC;