用于数据分析的星型架构模型
原文中文,约2900字,阅读约需7分钟。发表于: 。有一定数据分析或数据仓库经验的同学对这一模型早已耳熟能详。但我还想多说两句,星型数据模型就是为分析而准备的,因维度表围绕事实表构成的模型很像一颗星星而得名。(如下图)当然他还有一个孪生兄弟叫雪花模型(Snowflake), 雪花模型的唯一区别是再有层次机构数据时候,允许维度表组织成层次结构的一对多关系。而在星型模型中你需要将这个层次结构扁平化(后面讲到具体方法)。两种模型各有优劣,星型模型利于编写...
星型数据模型用于数据分析,维度表围绕事实表构成,形似星星。与雪花模型不同,星型模型需扁平化层次结构。维度表包含分析属性,事实表记录事件。生成星型模型需确认粒度并进行ETL,维度表的自然键和代理键用于关联。主要挑战包括维度表更新和事实表数据量大。数据清洗是规范数据的过程,良好的数据模型能帮助企业充分利用数据资产。