第七章
函数依赖
(1)网络考试系统中,有函数依赖 ername→dname(×)
(2)一个关系模式中不同属性在取值上总会存在相互依赖又相互制约,这种属性与属性之间的联系,称为函数依赖(×)
(2.1)一个关系模式中不同属性在取值上总会存在相互依赖又相互制约,这种属性与属性之间的联系,称为数据依赖(√)
(3)给定关系模式S的函数依赖集D,可以证明其它一些函数依赖也成立,就称这些被证明成立的函数依赖是被D逻辑蕴涵(√)
(3.1)给定关系模式S的函数依赖集D, D逻辑蕴涵的所有函数依赖的集合称为D的闭包(√)
(4)考官表中,按照反射律,(erid,ername)→ername成立(√)
(5)考官表中,erid→ername成立,则(erid,erage)→(ername,erage)也成立,依据是增广律(√)
(5.1)考官表中,erid→ername成立,则(erid,erage)→(ername,erage)也成立,依据是传递律(×)
(6)当考官号→考官院系名,考官院系名→考官院系办公地点,都成立时,考官号→考官院系办公地点 也成立,这依据的是增广律(×)
(7)H与G等价则H中的每个函数依赖属于G的闭包(√)
(7.1)H与G等价则H中的每个函数依赖属于H的闭包(√)
(7.2)
(8)
(9)
(9.1)
(10)
(11)
(12)
(13.1)
(13.2)
(13.3)
(14)
模式分解
(1)非无损联接的分解意味着分解将导致信息丢失(√)
(2)把一个关系模式分解为两个关系模式时,分解具有无损联接性的充分必要条件:两个关系模式的公共属性是这两个模式的键(×)
(2.1)把一个关系模式分解为两个关系模式时,分解具有无损联接性的充分必要条件是两个关系模式的公共属性是其中一个模式的键(√)
(3)模式分解需要关注的特性是:是否无损联接、是否保持依赖(√)
(4)如果某个分解不能保持函数依赖,则分解后的模式利用函数依赖约束来保护数据完整性的能力将会被削弱(√)
(5)保持函数依赖的分解必定具有无损连接性(×)
(6)
(7)
范式
(1)设K为S< A , D >的属性或属性组,若K → \rightarrow → A,则称K为S的候选键(×)
(1.1)设K为S< A , D >的超键,若K完全决定A,则称K为S的候选键(√)
(2)如果关系模式 S S S 的每个关系表 t t t 的属性值都是不可分的原子值,那么称S是第1范式(简称1NF)的模式
(2.1)如果关系模式S∈1NF,且每一个属性都不部分依赖于S的任何候选键,则S∈2NF(×)
(2.2)如果关系模式S<A,D>是1NF,且每个属性都既不部分也不传递依赖于S的任何候选键,那么称S是第三范式(3NF)的模式(×)
(2.3)如果关系模式S<A,D>是第三范式,它的任何一个主属性都既不部分也不传递依赖于S的任何候选键,则称S∈BCNF(√)
(2.3.1)
(2.4)关系模式S<A,D> ,它的任何一个主属性都既不部分也不传递依赖于任何候选键,则称S∈BCNF(×)
(2.5)关系模式S<A,D>∈1NF,其D中任意一个非平凡函数依赖的决定因素都包含键,则S∈BCNF(√)
(3)
(4)如果关系模式S∈1NF,且每一个属性都不部分依赖于S的任何候选键,则S属于且仅属于2NF(×)
(5)
(6)
(7)
规范化
(1.1)如果仅要求分解具有无损联接性,那么一定能够达到BCNF(√)
(1.2)如果要求分解既具有无损联接性,又具有保持依赖性,则一定能够达到3NF,而不可能达到BCNF(×)
(1.3)如果要求分解既具有无损联接性,又具有保持依赖性,则一定能够达到3NF,但不一定能够达到BCNF(√)
(2)关系模式规范化实际上就是一个模式分解过程:把逻辑上相对独立的信息放在独立的关系模式中(√)
(3)把较低范式的关系模式分解为若干较高范式的关系模式的方法不是唯一的,只有能够保证分解后的关系模式与原关系模式等价,分解才有意义(√)
(4)
(5)
(6)
大数据与反规范化
(1)同一个数据库,设计达到的范式越高,结果表个数越多(√)
(2)若关系模式的规范化程度越高,优势在于数据冗余、插入异常、删除异常、修改复杂等问题越少(√)
(2.1)关系模式的规范化程度高的劣势在于查询效率低(√)
(2.2)同一个数据库,设计达到的范式越高,结果表个数越多(√)
(3)较低范式的劣势在于数据冗余造成的空间代价以及修改代价(插入异常、删除异常、修改复杂)高(√)
(3.1)规范化程度低的优势是提高查询效率(√)
(3.2)若关系模式的规范化程度越低,优势在于可以减少查询所要联接表的个数,减少I/O和CPU时间,提高查询效率(√)
(4)数据冗余毫无益处(×)
(5)关系模式满足的范式级别越高越好(×)
第11章
大数据及其特征
(1)典型大数据应用中的数据在如下的一个或多个(4V)方面与传统技术面对的数据表现出显著不同:数据量(Volume)大、类型(Variety)多样、速度(Velocity)快、价值(Value)高而密度稀疏(√)
(2)大数据技术的目标乃是简单、高效并安全地共享大数据,支持大数据应用(√)
(3)大数据技术的关键需求包括:①可伸缩性,能够有效处理越来越多的数据和越来越多的访问。②可靠性,能够容忍实际合理的故障(√)
大数据存储技术
(1)与早前水平扩展的思想不同,目前面对大数据挑战,总是采用垂直扩展的方式(×)
(2)当前大数据应用中的分布式文件系统通常都采用主从结构(√)
(3)Google GFS中每个块的大小为64MB(√)
(4)为了应对可能随时发生的故障,文件的每个块都存有不同节点上的多个副本(√)
(5)当前大数据应用中的分布式文件系统,当面对数据修改时,需要分布式并发控制、提交和恢复机制来维护多个副本间的一致性,归根结底需要一个异步系统中的分布式共识协议(√)
(6)典型的NoSQL系统可以分为四类:键值存储系统、列族存储系统、文档存储系统和图存储系统(√)
(7)图数据库使用图作为数据模型,有一个节点集合和表征了节点关系的边集合(√)
大数据计算
(1)大数据计算有多种计算模式,最常见的是批处理和流计算两种(√)
(1.1)大数据处理和分析,代表性关键技术包括:MapReduce批处理、Storm流计算(√)
(2)流式计算处理的源数据通常是开放的,都是流数据,也称流式数据,是指将数据看作数据流的形式来处理(√)
(3)批处理的源数据通常是封闭的,通常将需要处理的大批量数据存入硬盘,处理的时候再从硬盘中读取数据进行一次性处理,如果产生了中间结果,需将中间结果写入外存,再继续后面的处理,因此批处理的I/O操作相对更加频繁(√)
(4)Storm流式计算框架结构中包括Spout和Bolt两种组件(√)
(5)Bolt用于从外部数据源接收数据,然后将其喷发到拓扑中的相应组件中去(×)
(6)Storm集群中守护进程Supervisor运行在主结点上,负责代码分发,为工作结点分配任务故障监测;守护进程Nimbus运行在工作结点上,负责监听分配给所在工作结点的任务,即根据Nimbus的任务分配来决定启动或停止工作进程执行Storm拓扑,一个Supervisor可能执行拓扑的一部分,也可能执行完整的拓扑(×)
(7)Storm集群中Supervisor保存了Storm的状态信息(×)
(8)MapReduce中,Map任务接收从不同Reduce任务得到的键相同的键-值对,执行用户编写的Map函数,将键相同的键-值对中的所有值以Map函数指定的方式组合起来,得到键-值对并输出(×)
大数据应用
(1)推荐系统通过研究用户的兴趣爱好,帮助用户从大数据中发觉自己潜在的需求,进行个性化推荐,缓解或解决信息过载问题(√)
(2)基于内容推荐方法根据用户兴趣模型与每一个物项特征模型之间的相似性来进行推荐(√)
(3)基于用户的协同过滤推荐方法是根据用户相似性进行推荐(√)
(4)基于物项的协同过滤推荐方法是根据物项相似性推荐(√)