数仓建模-模型实施


模型实施

如何从具体的需求或项目转换为可实施的解决方案,如何进行需求
分析、架构设计、详细模型设计等,则是模型实施过程中讨论的内容。

业界常用的模型实施过程

1、Kimball模型实施过程

Kimball 维度建模主要探讨需求分析高层模型详细模型模型审查整个过程。

构建维度模型一般要经历三个阶段:

  • 1、第一个阶段是高层设计时期 定义业务过程维度模型的范围,提供每种星形模式的技术和功能描述。
  • 2、第二个阶段是详细模型设计时期,对每个星形模型添加属性和度量信息。
  • 3、第三个阶段是进行模型的审查、再设计和验证等工作。
  • 4、第四个阶段 是产生详细设计文档,提交 ETL 设计和开发。

高层模型

高层模型设计阶段的直接产出目标是创建高层维度模型图,
它是对业务过程中的维表和事实表的图形描述。
确定维表创建初始属性列表,为每个事实表创建建议度量。

详细模型

详细的维度建模过程是为高层模型填补缺失的信息,解决设计问题,并不断测试模型能否满足业务需求,
确保模型的完备性。确定每个维表的属性和每个事实表的度量,并确定信息来源的位置、定义,确定属性和度量如何填入模型的初步业务规则。

模型审查、再设计和验证

本阶段主要召集相关人员进行模型的审查和验证,根据审查结果对详细维护进行再设计。

提交ETL设计和开发

最后,完成模型详细设计文档,提交ETL开发人员,进入ETL设计和开发阶段,由ETL人员完成物理模型的设计和开发。

2、Inmon模型实施过程

Inmon对数据模型的定位是:
扮演着通往数据仓库其他部分的智能路线图的角色。
由于数据仓库的建设不是一蹴而就的,为了协调不同人员的工作以及适应不同类型的用户,
非常有必要建立一个路线图————数据模型,描述刷数据仓库各部分是如何结合在一起的。

Inmon将模型划分为三个层次:

  • 1、ERD(Entity Relationship Diagram,实体关系图)层。
  • 2、DIS(Data Item Set,数据项集)层。
  • 3、PM(Physical Model,物理模型)。

ERD 层是数据模型的最高层,该层描述了公司业务中的实体或主题域以及它们之间的关系;ERD 层是中间层,该层描述了数据模型中的关键字、属性以及细节数据之间的关系;物理层是数据建模的最底层该层描述了数据模型的物理特性。
Inmon 对于构建数据仓库模型建议采用螺旋式开发方法,采用迭代方式完成多次需求。但需要采用统一的 ERD 模型,才能够将每次迭代的结果整合在一起。 ERD 模型是高度抽象的数据模型,描述了企业完整的数据。而每次迭代则是完成 ERD 模型的子集,通过DIS物理数据模型实现。


文章作者: Callable
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Callable !
评论
  目录