0
点赞
收藏
分享

微信扫一扫

Inmon和Kimball - 伟大的数据仓库辩论

Jonescy 2022-01-15 阅读 84

Inmon和Kimball - 伟大的数据仓库辩论

  > Photo by comfreak on Pixabay

  Pioneers Bill Inmon,被称为“数据仓库之父”和RALPH Kimball,一个思想的维度数据仓库领导者,具有持续的辩论。根据Kimball的说法:“数据仓库只不过是所有数据集市的联盟”,Inmon 回应:“你可以抓住海洋中的所有小鱼并在一起堆叠 - 他们仍然不是鲸鱼”。

  

Inmon和Kimball - 伟大的数据仓库辩论

  这是他们争论的:在典型的数据仓库中,我们从一组OLTP数据源开始。这些可以是XL表,ERP系统,文件或基本上是任何其他数据源。数据到达暂存环境后,ETL工具用于处理和转换数据,然后将其送入数据仓库。据INMON介绍,在ETL过程之后,应将数据直接进入数据仓库。然而,Kimball保持在ETL过程之后,数据应加载到数据集市中,与所有这些数据集市的联盟创建概念(不是实际)数据仓库。

  惯性方法被称为自上而下或数据驱动的方法,从而从数据仓库开始并将其分解为数据集市,专门从事组织内不同部门的需求,如金融,会计,小时等

  Kimball方法被称为自下而上或用户驱动,因为我们从用户特定的数据集市开始,而这些是我们概念数据仓库的构建块。重要的是从型号最适合您的需求的开始非常重要,以便它可以内置于数据仓库模式中。

  

Inmon和Kimball - 伟大的数据仓库辩论

  > The Inmon approach (diagram by the author)

  

Inmon和Kimball - 伟大的数据仓库辩论

  > The Kimball approach (diagram by the author)

  为了说明,我们可以考虑一个数据仓库,就像一个归档柜,数据集市为抽屉。对于初中,我们将所有数据传输到我们的档案柜(AKA数据仓库)中,然后我们决定将哪些主题特定的抽屉(AKA数据集更)放入。相反,对于Kimball来说,我们从一些主题特定的抽屉(数据集市)开始反映谁需要使用什么数据,如果我们想要,我们可以将它们堆进到内阁地层(数据仓库)中,但是在结束当天,他们只是一堆抽屉,我们是否将它们携带到内阁中。

  

Inmon和Kimball - 伟大的数据仓库辩论

  Photo by Jan Antonin Kolar on Unsplash and edited by the Author

  这是某个实体的业务需求,以确定对它们的正确方法。以下是说明的一些例子:

  保险:为了基于未来的预测管理风险,我们需要在所有保单持有人跨越广泛的画面,这些数据组成,例如盈利,历史,人口统计等数据。所有这些方面都是相互关联的,所以大道方法从仓库中的所有数据开始并根据需要过滤它是最适合的。制造过程:在制造过程中,需要考虑到各种相互关联的功能,以便进行业务的顺利运行,如库存,商店容量,生产能力,人间,因此,近代的方法是理想,使所有可用的信息可根据需要使用。营销:这是一个专业领域,我们不需要查看营销的各个方面,以便为分析而言。所以,我们不需要企业仓库 - 一些数据集市已经足够 - Kimball方法。

  结论

  2022年,Gartner估计,60%的数据仓库实施将只有受限的接受或完全失败。为了提高验收和成功,从一开始就正确地为您的需求设置数据仓库是很重要的。采取错误方法的含义昂贵且耗时。当考虑到哪种方法进行邻近的方法或Kimball - 考虑诸如预算等因素,数据量,数据速度,数据品种和数据准则。然后留出陷阱,比如不恰当的软件,业务与团队之间的沟通不当,成本估算不佳等。

  这是经验真的很重要的地方。你可能认为的是正确的方法可能不是我认为是正确的方法,而且没有适当地了解所有影响,可以做出错误。通过正确的经验,您可以找到一种成本效益的方法来构建一个节省时间的解决方案。

  我们希望我们对Ovmon和Kimball论证的讨论是有用的作为起点。

  谢谢阅读!

举报

相关推荐

0 条评论