0
点赞
收藏
分享

微信扫一扫

【无标题】数据仓库基础知识

杨沐涵 2022-02-24 阅读 77

目录

数据仓库维度模型设计

1、维度建模
维度建模是数据仓库领域最流行的数仓建模经典。维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求模型,因此他的重点在于坚决用户如何快速的完成数据分析需求,同时还有较好的大规模复杂查询相应性能。
2、事实表
发生再现实世界中的操作型事件产生的可度量数值,存储再事实表中。从最低的粒度级别来看,事实表对应一个度量时间,反之亦然。
3、维度表
每个维度表都包含单一的主键列。维度表的主键可以作为与之关联的任何事实表的外键,维度表通常比较宽,是扁平非规范表,包含大量的低粒度的文本属性。维度表示你要对数据进行分析时所用的一个量。

维度建模的三种模式

1、星型模型
星型模型是最常用的维度建模方式,是以事实表为中心,所有的维度表直接连接再事实表上,类似星星一样,所以叫做星型建模,一般来说,星型建模具有以下特点:
a.维度表和事实表关联,维度表之间没有关联;
b.每个维度表主键为单列,且该主键放置在事实表中,作为两边连接的外键;
c.以事实表为核心,维度表围绕核心呈星型分布。
2、雪花模式
雪花模式是对星型模式的扩展,雪花模式的维度表可以拥有其他维度表的,虽然这种模型比星型模型更规范一些,但是维护成本较高,而且性能方面需要关联多成维度表,性能上比星型表要低,一般不用。
3、星座模型
星座模型是由星型模型延伸而来,星型模型是基于一张事实表的,而星座模式是基于多张事实表的,而且共享维度信息。

数据仓库基本理论知识

1、数据仓库为什么要分层?
分层的目的在于管理数据的时候,能数据有一个更加清晰的掌控,详细来讲,主要有以下几个原因。
a.清晰的数据结构:每一个数据分层都有它的作用域,我们在使用的时候方便定位和理解;
b.数据血缘追踪:简单来说,我们最终给业务呈现的是一个能直接使用的业务表,但是它的来源有很多,如果有其中的一张源表出现了问题,方便我们快速准确的定位到问题。
c.减少重复开发:规范数据仓库分层,开发一些通用的中间层数据,能够极大的减少重复运算。
d.把复杂问题简单化:将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。
e.屏蔽原始数据的异常:屏蔽业务的影响,不必改一次业务就需要重新接入数据。
2、数据分层思想
数据分层可以根据自己的业务需求来分成不同的层次,但是最基础的分层思想理论上将数据分为三层,ODS层,DW层和DWD层,基于这个分层之上再添加新的层次,来满足不用的业务需求。
未完待续。。。

举报

相关推荐

0 条评论