系统架构设计师教程-学习-记录(15)计算机网络基础知识-数据库系统基础知识(1)关系数据库基础
- 初
- 记
- 数据库系统基础知识
- 1.1 数据库(DataBase, DB)
- 1.2 数据库系统 (DataBase, DB)
- 1.3 数据库管理系统(DataBase Management System, DBMS)
- 关系数据库基础
- 1、数据库的结构与模式
- 2、实体-联系(E-R)模型
- 3、数据的规范化
- 4、事务管理
- 5、并发控制
- 6、数据库备份与恢复
初
- 学习《系统架构设计师教程》,初心是为了学习更多知识,在计算机技术方面得到更大的提升。
- 希望自己记录学习的时候也能总结一些知识分享出来。也可能错误很多,希各个大佬多多包涵并指点一二,在此感谢。
记
数据库系统基础知识
1.1 数据库(DataBase, DB)
数据库(DataBase, DB)是指长期储有在计算机内的、有组织的、可共享的数据集合。
1.2 数据库系统 (DataBase, DB)
数据库系统采用三级模式结构,数据库系统在三级模式间提供了两级映像:模式/内模式映像、外模式/模式映像来保证数据库中数据具有较高的逻辑独立性和物理独立性。
数据库系统 (DataBase System, DBS) 广义上由下面 4 个组成
- 数据库
- 硬件
- 软件
- 人员
而数据库系统管理的对象是 “ 数据 ”
1.3 数据库管理系统(DataBase Management System, DBMS)
数据库管理系统(DataBase Management System, DBMS)是一种操纵和管理数据库的大型软件, 用于建立、使用和维护数据库。
数据库管理系统(DataBase Management System, DBMS) 主要功能:
- 数据定义
- 数据库操作
- 数据库运行管理
- 数据组织
- 存储和管理
- 数据库的建立与维护
- 其他功能
DBMS通常分为三类:
- 关系数据库系统(Relation DataBase Systems, RDBS)
- 面向对象的数据库系统(Object-Oriented DataBase system, OODBS)
- 对象关系数据库系统(Object-Oriented Relation DataBase system, ORDBS)
关系数据库基础
1、数据库的结构与模式
数据库结构的基础是数据模型,是用来描述数据的一组概念和定义。
数据模型的三要素
- 数据结构
- 数据操作
- 数据的约束条件
常用的数据模型
- 概念数据模型
- 基本数据模型
- 面向对象模型
关系数据库模型由关系结构、关系操作集合和完整性约束三大要素组成。
2、实体-联系(E-R)模型
概念模型中最常用的方法为实体-联系方法,简称 E-R 方法。
E-R 主要概念有
- 实体
- 联系
- 属性
构件 | 说明 |
矩形 | 表示实体集 |
菱形 | 表示联系集 |
椭圆 | 表示属性 |
线段 | 将属性与相关的实体集连接,或将实体集与联系集相连 |
双椭圆 | 表示多值属性 |
虚椭圆 | 表示派生属性 |
双线 | 表示一个实体全部参数与到联系集中 |
E-R 模型强调的是语义,与现实世界的问题密切相关。
扩充的 E-R 模型包括弱实体、特殊化、概括和聚集等
3、数据的规范化
规范化理论研究的是关系模式中各属性之间的依赖关系及其对关系模式性能的影响。关系数据库设计理论的核心是数据间的函数依赖,衡量的标准是关系规范化的程度及分解的无损连接和保持函数依赖性。
数据依赖是通过个关系中属性间值的相等与否体现出来的数据间的相互关系, 是现实世界属性间联系和约束的抽象,是数据内在的性质,是语义的体现。函数依赖则是一种最重要、 最基本的数据依赖。包括函数依赖、非平凡的函数依赖、平凡的函数依赖、完全函数依赖、部分函数依赖、传递依赖、码、主属性和非主属性、外码、值依赖定义、函数依赖的公理系统( Armstrong公理系统)。
范式是关系模型满足的确定约束条件。
范式:
INF (第一范式)
2NF (第二范式)
3NF (第三范式)
BCNF (巴克斯范式)
4NF (第四范式)
5NF(第五范式)
其中INF级别最低。
关系模型的规范化是指把一个低一 级范式的关系模式转换成若干个高一级范式的关系模式的过程。关系数据库设计的方法之一就是设计满足适当范式的模式,并通过判断 分解后的模式达到第几范式来评价模式规范化的程度。
4、事务管理
事务是一个操作序列,这些操作“要么都做,要么都不做”,事务是数据库环境中不可分割的逻辑工作单位。事务和程序是两个不同的概念,一般一个程序可包含多个事务。
事务的4个特性, 这4个特性也称为事务的ACID性质。
- 原子性(atomicity)
- 一致性 (consistency)
- 隔离性( isolation)
- 持久性(durabiliy)
在SQL语言中事务定义的语句有三条: BEGIN TRANSACTION事务开始COMMIT事务提交和ROLLBAK事务回滚。
5、并发控制
并发操作是指在多用户共享的系统中,用户可能同时对同一数据进行操作。
并发操作带来的问题是数据的不一致,主要有丢失更新、不可重复读和读脏数据。其主要原因是事务的并发操作破坏了事务的隔离性。DBMS的并发控制子系统负责协调并发事务的执行,保证数据库的完整性不受破坏,避免用户得到不正确的数据。
并发控制的主要技术是封锁。封锁的类型有排他锁(简称X锁或写锁)和共享锁(简称S锁或读锁)。并发控制还与三级封锁协议、活锁与死锁、并发调度的可串行性、两段封锁协议、封锁的粒度、事务的嵌套等有关。
6、数据库备份与恢复
在数据库的运行过程中,难免会出现计算机系统的软、硬件故障,从而影响数据库中数据的正确性,甚至破坏数据库,使数据库中全部或部分数据丢失。因此,保护数据库的关键技术在于建立冗余数据,即备份数据。建立冗余数据的方法是进行数据转储和建立日志文件。数据的转储分为静态转储和动态转储、海量转储和增量转储。如何在系统出现故障后能够及时使数据库恢复到故障前的正确状态,就是数据库恢复技术。
数据库的4类故障
- 事务故障
- 系统故障
- 介质故障
- 计算机病毒
事务故障的恢复
- 撤销事务(UNDO)
- 重做事务(REDO)。
介质故障的恢复需要数据库管理员(DataBase Administrator, DBA) 的参与,装入数据库的副本和日记文件副本,再由系统执行撤销和重做操作。
在一个数据库系统中,这两种方法一般是同时采用的。 为了避免磁盘介质出现故障影响数据库的可用性,许多DBMS提供数据库镜像功能用于数据库恢复,数据库镜像是通过复制数据实现的,但频繁地复制数据会降低系统的运行效率,因此实际应用中往往只对关键的数据和日志文件镜像。
https://www.edrawsoft.cn/viewer/public/s/0afd3473755220