(十八)、函数依赖集
两个函数依赖集等价是指它们蕴涵的属性间的依赖信息等价,一个函数依赖集所蕴涵的全部函数依赖为其闭包,如果两个函数依赖集的闭包相等,即它们蕴涵的全部函数依赖相同,即为等价。
(二十)、数据挖掘
数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种即关联分析、序列模式分析、分类分析和聚类分析。
①关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R={A1, A2,...,AP}为{0,1}域上的属性集,r为R上的一个关系,关于r的关联规则表示为X→B,其中XER,BER,且XNB=a。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。