阿里云服务器的maxcompute的数据库管理构架为例子,

 

 

从上往举例论证, 

dwp的数据信息,来源于是dws dim,最主要是dws。这儿不探讨dim的功效。

dws的数据信息来自dwd。

dwd的数据信息来自ods。

--------

下面大家界定分子指标值和继承指标值。

继承指标值界定在dws层。而且关联分子指标值。全部的运用数据信息由继承指标值去group by。

分子指标值界定在dwd层 虚似层。分子指标值关联一个dwd的衡量值,可是有可能会出现测算,因此不彻底在dwd,运作的情况下很有可能会开展测算。称之为一个虚似的层。

当然可以把这个虚似层做出去,专业做一层分子指标值层。

 

这个时候大家的指标值智能管理系统里边应当有下列物品:

  指标值名字  指标值来源于 指标值规格
分子指标值 能够 与衡量值一致,还可以不一致 关联dwd的表名和字段

1.和关联的dwd的衡量值彻底相匹配

2.必须 一点测算,入录测算逻辑性

继承指标值 形容词 分子指标值名字 时间周期 关联一个分子指标值   

①形容词:做为where过虑的字段名

②时间周期:近7天,近一个月等

③汇聚实际操作:均值,求饶等

③汇聚层面,还可以不录,在实体模型管理方法里录

运用指标值 同同比 形容词 继承指标值 关联一个继承指标值

①汇聚的层面:继承指标值所属表的字段名

②很有可能有一些简易的过虑。

③很有可能会出现一些同同比的测算

肯定不允许有字段名测算,如乘除法,if转换等,如果有,表明逻辑性沒有下移。

 

 

举个事例:

运用指标值必须 :当月客流量超过2w次而且付款方式为支付宝钱包的的均值订单金额净提高,层面:每一个大城市

有着的业务流程全过程:订单信息表。店面人流量表。

  名字   来源于 规格
分子指标值 订单金额 买卖表:付款额度,返款额度 付款额度-返款额度
继承指标值

当月客流量超过2w次

而且付款方式为支付宝钱包的的均值订单金额

订单金额

①形容词:

where 付款方式=支付宝钱包

having 月客流量>2w

②时间周期

where 订单信息时间一个月

③汇聚实际操作:均值

③层面:大城市,类目

(汇聚层面比业务流程指标值更宽)

运用指标值

当月客流量超过2w次

而且付款方式为支付宝钱包的的均值订单金额净提高

当月客流量超过2w次

而且付款方式为支付宝钱包的的均值订单金额

①汇聚层面:大城市

②环比计算,当月减上月

之上将一个运用指标值的测算逻辑性沉积到不一样的层级中的指标值管理方式,完成了从衡量值到最终运用指标值的统一,再再加上专业术语智能管理系统,

能够 处理指标值同名的不一样义,同义词不一样名的规格难题。称作one data,即一个运用指标值有且只有唯一的测算逻辑性。

----------------------------------------------------------------------------------------

《模型的作用》

dws的表能够 称作继承指标值的实体模型。

一个继承指标值能够 有不一样的层面。例如近7月,近一个月,大城市类目的,大城市商业圈的,因此 继承指标值:实体模型 = 1:n

能够 在入录不一样层面的继承指标值时,

①作为是不一样的继承指标值,将层面作为规格记下来

②作为是同一个继承指标值,基本建设不一样层面的实体模型(表),关联这一继承指标值。假如那么做,运用指标值关联的将并不是继承指标值,只是dws实体模型里的字段名。

----------------------------------------------------------------------------------------

《是否可以将度量值认为是原子指标》

分子指标值意味着的是指标值的底层,是服务项目于指标值系统软件的。衡量值意味着的是业务流程产生的全过程中造成的数据信息,是纪录业务流程客观性状况的。

尽管二者的字段名有很多重叠的地区,最好是将分子指标值彻底改变,避免指标值体系管理和数仓公共性表基本建设过度藕合而扩大统一指标值规格的难度系数。

----------------------------------------------------------------------------------------

《派生指标和应用指标的区别》

运用指标值的来源于是继承指标值,不一定要测算同同比,许多情况下名字是一模一样的。

她们的差别取决于层面。

dws为了更好地达到大量的运用指标值的测算,层面会大量 更准。

举个例子,层面为大城市 类目 商业圈 店面级别 的订单金额,能够 卷起 大城市层面,类目层面,商业圈层面,大城市 类目层面,等高达15个组成的运用指标值。

那样BI测算运用指标值的情况下,就只需依据自身关注的层面做group by就可以,比较简单便捷。

 

评论(0条)

刀客源码 游客评论