0
点赞
收藏
分享

微信扫一扫

SDUT 数据库系统概论 第六章 关系数据库理论

人间四月天i 2022-03-24 阅读 26
数据库

文章目录


6.1 问题的提出

如何构造一个适合的数据库模式是建立数据库系统很基本的问题,这是数据库的设计问题,确切的说是关系数据库逻辑设计问题,我们有一个有利工具:关系数据库的规范化理论。

6.1.1 关系模式的表示

关系模式的表示:五元组 R (U,D,DOM,F)
关系名 R 是符号化的元组语义。U 为一组属性。D 为属性组 U 中的属性所来自的域(即取值范围)。DOM 为属性到域的映射(即具体的取值)。F 为属性组 U 上的一组数据依赖
由于 D 和 DOM 与模式设计关系不大,可以把关系模式看做三元组:R<U,F> ,当且仅当 U 上的一个关系 r 满足 F 时,r 称为关系模式 R<U,F> 的一个关系。
二维表的关系的基本条件:每一个分量必须是不可分的数据项,满足了这个条件的关系模式就属于第一范式。

6.1.2 数据依赖

数据依赖
是一个关系内部属性与属性之间的约束关系。
是通过属性间值的相等与否体现出来的数据间相关联系。
是现实世界属性间相互联系的抽象。
是数据内在的性质。
是语义的体现。

主要有两类数据依赖:函数依赖(FD)、多值依赖(MVD)

6.1.2 好的关系模式

不会发生插入异常、删除异常、更新异常,
数据冗余应尽可能少。

  1. 数据冗余
    模式中的某一数据大量重复出现,这将浪费大量的存储空间。
  2. 更新异常
    由于数据冗余,当更新数据库中的数据时,系统要付出很大的代价来维护数据库的完整性,更新相关的其他暑假,否则会面临数据不一致的危险。
  3. 插入异常
    插入某一数据时,无法把数据库中原有的相关数据存入数据库。
    举例:如果一个系刚成立,尚无学生,则无法把这个系及其系主任的信息存入数据库
  4. 删除异常
    举例:如果某个系的学生全部毕业了,则在删除该系学生信息的同时,这个系及其系主任的信息也丢掉了。

6.2 规范化

规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。

6.2.1 函数依赖

函数依赖的定义:设 R(U) 是属性集U上的关系模式,X 和 Y 是 U 的子集,r 是 R(U) 的任意一个关系r 中不可能存在两个元组在 X 上的属性值相等, 而在 Y 上的属性值不等, 则称 “ X 函数确定 Y ” 或 “ Y 函数依赖于 X ”,记作 X→Y。(就是一个X只能对应一个Y

1、解释
函数依赖是语义范畴的概念,只能根据语义来确定。
数据库设计者可以作强制的规定,并且这是所有关系实例均要满足的约束条件。
在这里插入图片描述
2、类型
在这里插入图片描述

6.2.2 码

在这里插入图片描述
主码或候选码一般简称是码。

6.2.3 范式

关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式。
R 属于 xNF
低>>高(同时也是包含关系):1NF 2NF 3NF BCNF 4NF 5NF
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化
例:一个1NF 可以分成多个2NF。

6.2.4 第一范式

第一范式(1NF):(最低级) 每一个分量必须是不可分的数据项,第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库

6.2.5 第二范式

2NF 定义:R 是1NF,且每一个非主属性完全函数依赖于任何一个候选码,则 R 是第二范式。
一个表只能保存一种数据,消除部分函数依赖,不可以把多种数据保存在同一张表上。

若 R 不属于 第二范式,就会产生的问题:

  1. 插入异常
  2. 删除异常
  3. 修改复杂

将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

6.2.6 3NF

在这里插入图片描述
若R∈3NF,则每一个非主属性既不部分依赖于码也不传递依赖于码。
通过外键建立表间的联系。

6.2.7 BCNF

在这里插入图片描述
BCNF的判断方法 或者 结论:

  1. 所有非主属性对每一个码都是完全函数依赖。
  2. 所有的主属性对每一个不包含它的码,也是完全函数依赖。
  3. 没有任何属性完全函数依赖于非码的任何一组属性。

6.2.8 4NF

关系模式 R<U,F> ∈ 1NF,如果对于R的每个非平凡多值依赖X→→Y(Y ∉ X),X都含有码,则R∈4NF。
不允许有非平凡且非函数依赖的多值依赖。
允许的非平凡多值依赖是函数依赖。

实例总结

关系数据库的规范化理论是数据库逻辑设计的工具。其目的是尽量消除插入、删除异常,修改复杂,数据冗余。
基本思想:逐步消除数据依赖中不合适的部分。
实质:概念的单一化。
在这里插入图片描述

1、
在这里插入图片描述
如上图的表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这⾥违反了第⼆范式的设计原则。是一个1NF。

2、
拆分为2NF:
在这里插入图片描述
在这里插入图片描述

3、
若R∈3NF,则每一个非主属性既不部分依赖于码,也不传递依赖于码。
如,在设计⼀个订单数据表的时候,可以将客户编号作为⼀个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(如姓名、所属公司等)的字段。
如下图
在这里插入图片描述

4、
BCNF的反例
在这里插入图片描述

5、 其他例题
在这里插入图片描述

举报

相关推荐

0 条评论