subtitle
04
28
事实表设计 事实表设计
事实表设计 学习《大数据之路》第11章,《事实表设计》摘要。 事实表基础事实表特性事实表作为数据仓库维度建模的核心,进进围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和业务过程有关的度量。事实表中一条记录
2021-04-28
27
维度设计 维度设计
维度设计 学习《大数据之路》第10章,《维度设计》摘要。 维度设计基础维度的基本概念 维度是维度建模的基础和灵魂。在维度建模中,讲度量称为”事实”,将环境描述称为”维度”,维度是用于分析事实所需要的多样环境。 维度所包含的表示维度的列,
2021-04-27
16
hive开窗函数中range和rows的区别 hive开窗函数中range和rows的区别
hive开窗函数中range和rows的区别转载地址 1、rows是物理窗口,是哪一行就是哪一行,与当前行的值(order by key的key的值)无关,只与排序后的行号相关,就是我们常规理解的那样。 2、range是逻辑窗口,与当前行
2021-04-16
12
数据仓库的模型设计 数据仓库的模型设计
数据仓库的模型设计 A. 数据建模方法论数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。 模型设计分为三个阶段:1、概念模型对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。为什么要划分主题域?划分主题域,是根据业务的应用
2021-04-12
09
数仓建模-OneData 数仓建模-OneData
OneData 实施过程1、指导方针首先,在建设大数据数据仓库时,要进行充分的业务调研和需求分析。这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次,进行数据总体架构设计,主要是根据数据域对数据进行划
2021-04-09