Tendon 数据汇总模块,包括指标定义和指标计算两部分。数据汇总有时也叫数仓cube。
指标定义,用来统一指标口径,避免
指标分类
指标通过划分,
原子指标
基于业务过程的度量值,通常也就是SQL中的聚合函数sum、count、distinct、avg、max、min等。
组成部分 | 示例 | SQL示例 |
业务过程 | 购买 | |
度量 | 用户数 | count(distinct *) |
派生指标
由以下组成:原子指标、统计粒度、统计周期、业务限定等四部分组成。
组成部分 | 示例 | SQL示例 | |
原子指标 | 购买用户数 | count(distinct user_id) | |
统计周期 | 最近30天 | where dt >= now_round_start(-30d) | |
业务限定 | VIP会员 | where user_type = 'vip' | |
统计粒度 | 商品 | group by bid |
复合指标
由若干个派生指标,进行逻辑运算复合成的。
常见的有比率、比例。
指标计算
实时计算
source --> 数据过滤 --> 时间窗口 --> 派生指标 --> 复合指标
离线计算
离线计算和实时计算非常相似,只是实时计算使用时间窗口,离线计算则算出窗口编号。