数仓建模-OneData


OneData 实施过程

1、指导方针

首先,在建设大数据数据仓库时,要进行充分的业务调研需求分析
这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。
其次,进行数据总体架构设计,主要是根据数据域对数据进行划分;按照维度建模理论,构建总线矩阵、抽象出业务过程和维度。
再次,对报表需求进行抽象整理出相关指标体系,使用工具完成指标规范定义和模型设计。
最后,就是代码研发和运维。

2、实施流程

业务调研是否充分,将会直接决定数据仓库建设是否成功。
https://qingtong-1251156042.cos.ap-beijing.myqcloud.com/2021-04-09-%E5%AE%9E%E6%96%BD%E5%B7%A5%E4%BD%9C%E6%B5%81.png

需求调研的途径有两种:
1、是根据与分析师、业务运营人员的沟通(邮件、 IM )获知需求;
2、是对报表系统中现有的报表进行研究分析通过需求调研分析后,就清楚数据要做成什么样的。
很多时候,都是由具体的数据需求驱动数据仓库团队去了解业务系统的业务数据,这两者并没有严格的先后顺序。

数据域划分:
数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。
业务过程可以概括为一个个不可拆分的行为事件,如下单、支付、退款。
为保障整个体系的生命力,数据域需要抽象提炼,并且长期维护和更新,但不轻易变动。
在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中或者扩展新的数据域。


构建总线矩阵:
在进行充分的业务调研和需求调研后,就要构建总线矩阵了。
需要做两件事情:
1、明确每个数据域下有哪些业务过程;
2、业务过程与哪些维度相关,并定义每个数据域下的业务过程和维度。

总结

OneData的实施过程是一个高度迭代和动态的过程,一般采用螺旋式实施方法。
在总体架构设计完成之后,开始根据数据域进行迭代式模型设计和评审。
在架构设计、规范定义和模型设计等模型实施过程中,都会引人评审机制,以确保模型实施过程的正确性。


文章作者: Callable
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Callable !
评论
  目录