--------------------- 多表联合查询
理论依据:笛卡尔积
通过笛卡尔乘积,把两个或者多个表变为一个大表,里面包含了有效的,无效的记录(需要加条件进行过滤数据)
例如:查询学生的姓名,性别,以及学生所在院系的名称
SELECT * FROM student; -- 例如,王五,did=1001
SELECT * FROM DEPARTMENT WHERE did=1001;
SELECT * FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did;
SELECT sname,ssex,dname FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did;
例如:查询学生额姓名,年龄,这个学生选的课程名称,以及这门功课考试分数;
SELECT * FROM student,course,score WHERE student.sid = score.sid AND score.cid =course.cid;
SELECT sname,sage,cname,grade,STUDENT.sid FROM student,course,score
WHERE student.sid = score.sid AND score.cid =course.cid;
-- 如果实际工作中,表名多,且长,可以给表起别名:
SELECT sname,sage,cname,grade,s.sid FROM student s,course c,score s2
WHERE s.sid = s2.sid AND s2.cid =c.cid;
-- 总结
1、多表联合查询,你想要的数据在多个表中,得从多个表中查询获取,但是必须添加条件过滤,
如果不加条件,会出现大量错误数据。
2、条件,连接条件:先分析表跟表之间的关系,分析数据和数据之间的关系,把关系写成 SQL 语句:
多数情况下,表和表之间的关系是主外键关系,但是有特殊,有例外。
3、一个连接条件,只能连2个表,如果要连接N个表,至少需要 N-1 个连接条件;
==》语法
SELECT * FROM 表名1,表名2,表名3,... WHERE 1个或者多个连接条件 [AND 查询条件];
查询内容: 全部信息、部分列(,间隔); 某一个表的全部列 表名.* ;
如果查询涉及到比较多的表,表名过长,可以给表起别名: 表名 别名,注意查询内容,查询条件中明确定义列
都必须使用别名,明确定义列就是指明列名。
例如:查询学生额姓名,年龄,这个学生选的课程名称,以及这门功课考试分数,只保留乘积高于80的学生信息
SELECT sname,sage,cname,grade,s.sid
FROM student s,course c,score s2
WHERE s.sid = s2.sid AND s2.cid =c.cid AND grade>=80;
练习:
emp dept
1. 查询员工的姓名、岗位、薪水、以及员工所在部门的名称、地点
SELECT * FROM emp; -- deptno 部门编号
SELECT * FROM dept; -- deptno
关系:部门表的部门编号和员工表的部门编号一样 -- 》 SQL : dept.deptno=emp.deptno
SELECT * FROM emp,dept WHERE dept.deptno=emp.deptno;
SELECT ename,job,sal,dname,loc FROM emp,dept WHERE dept.deptno=emp.deptno;
emp dept
2. 查询员工的所有列,以及员工所在部门的名称
SELECT emp.*,dname FROM emp,dept WHERE dept.deptno=emp.deptno;
3.查询学生的姓名、选的课程的名称,课时,成绩,所在院系名称
SELECT * FROM student,course,DEPARTMENT,score WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`
AND COURSE.cid=SCORE.cid;
SELECT sname,cname,chour,grade,dname FROM student,course,DEPARTMENT,score
WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`
AND COURSE.cid=SCORE.cid;
4. 查询计算机系的学生的姓名、选的课程的名称、课时、这门课考试的分数,以及这个学生所在系的名称
SELECT sname,cname,chour,grade,dname FROM student,course,DEPARTMENT,score
WHERE student.`DID`=DEPARTMENT.`DID` AND STUDENT.sid=SCORE.`SID`
AND COURSE.cid=SCORE.cid AND dname IN('计算机','数学')
特殊情况:有的表关系不是主外键关系,并且列名也不一样,但是一样的可以写多表联合查询
SELECT * FROM salgrade ; -- 工资就级别表
SELECT * FROM emp; -- 职工表,sal 表示薪水
DESC salgrade;
例如:查询员工的姓名,岗位,薪水,以及薪资所在的级别。
关系: 薪水>= 某级别最低工资 并且 薪水<=某级别最高工资,即薪水在某级别范围内 == 》薪资就属于该级别
变成 SQL 写出来: sal >=losal AND sal<=hisal 或者 sal BETWEEN losal AND hisal
SELECT * FROM emp,salgrade WHERE sal BETWEEN losal AND hisal;
-- 内连接,左连接,右连接(了解)
一、内连接 INNER JOIN,是多表联合查询的另外一种写法(笔试或者面试)
SELECT * FROM emp,dept WHERE dept.deptno=emp.deptno; -- 常规写法
SELECT * FROM emp INNER JOIN dept ON dept.deptno=emp.deptno; -- 内连接实现
二、左连接,右连接
左连接 LEFT JOIN : 将左表的内容全部显示,不管右表是否有对应的记录;
SELECT * FROM emp LEFT JOIN dept ON dept.deptno=emp.deptno;
右连接 RIGHT JOIN :将右表的内容全部显示,不管左表是否有对应的记录。
SELECT * FROM emp RIGHT JOIN dept ON dept.deptno=emp.deptno;
----------------------- 分组查询
分组查询主要是用来做统计的,一般都是按照某一个列进行统计
统计类型:求平均,求和,求最大,求最小等等
分组查询需要结合分组函数一起实现
COUNT(参数):统计查询语句返回的行数
MAX(参数):最大的
MIN(参数):最小的
SUM(参数):求和
AVG(参数):求平均
参数:一般都是列名,但是 COUNT() 的参数还可以是 * 或者是 1
注意:当参数是具体的列名的时候,函数会自动过滤掉列中的值是空值的情况,特别是count(),参数是列名,
就只统计列名非空情况,如果count(*),COUNT(1),即使空行,也会被统计。
例如:查询职工信息的数据,然后统计公司的员工人数,平均薪水,最高薪水,最低薪水。
SELECT * FROM emp;
SELECT COUNT(empno),COUNT(*),COUNT(1),AVG(sal),SUM(sal)/COUNT(empno),MAX(sal),MIN(sal)
FROM emp WHERE sal IS NOT NULL;
例如:统计部门编号为 10的员工总数,以及这个部门的平均薪水
SELECT * FROM emp WHERE deptno=10;
SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=10; -- 15
例如:统计每个部门的员工人数,以及该部门的平均薪水;按照部门编号进行分组统计部门的人数和部门的平均薪水
SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=20; -- 7
SELECT COUNT(*),AVG(sal) FROM emp WHERE deptno=30; -- 5
# 按照部门编号进行分组统计部门的人数和部门的平均薪水
按照 *** 分组: GROUP BY ***
SELECT COUNT(*),AVG(sal),deptno FROM emp GROUP BY deptno;
# 按照部门编号和岗位进行分组,统计每个部门每个岗位的人数及平均薪水
SELECT COUNT(*),AVG(sal),deptno,job FROM emp GROUP BY deptno,job;
==> 语法
关键词:
按照*** 进行分组: GROUP BY 列名,列名2,...
分组之后进行数据过滤: HAVING
SELECT 分组函数,被分组的列名 FROM 表名(1个或者多个表) [WHERE 连接条件] GROUP BY 1个或者多个列名 [HAVING 过滤条件]
# 按照部门编号和岗位进行分组,统计每个部门每个岗位的人数及平均薪水,只保留人数超过3个人的记录
SELECT COUNT(*),AVG(sal),deptno,job FROM emp GROUP BY deptno,job HAVING COUNT(*)>=3;
例如:按照部门名称及岗位进行分组统计,每个部门每个岗位的人数及平均薪水,并且保留人数超过3个记录。
SELECT COUNT(*),AVG(sal),dname,job
FROM emp,dept WHERE emp.`deptno`=dept.`deptno` GROUP BY dname,job HAVING COUNT(*)>=3 ;
练习:
1. 按照系别编号统计,每个系的学生人数,学生的平均年龄,学生最大年龄
SELECT * FROM STUDENT;
SELECT COUNT(*),AVG(sage),MAX(sage),did FROM STUDENT GROUP BY did;
SELECT COUNT(*),AVG(sage),MAX(sage),dname
FROM STUDENT,DEPARTMENT WHERE STUDENT.did=DEPARTMENT.did GROUP BY dname;
2. 按照性别去统计,统计每个性别的人数,性别最小年龄
SELECT COUNT(*),MIN(sage),ssex FROM student GROUP BY ssex;
3. 按照系别编号和性别一起去分组,统计每个系的男的多少人,女的多少人
SELECT COUNT(*),did,ssex FROM STUDENT GROUP BY did,ssex ORDER BY did DESC;