OneData指标体系

OneData介绍

OneData即是阿里巴巴内部进行数据整合及管理的方法体系和工具。

数据从业者能在这一体系下,构建统一、规范、可共享的全域数据体系,避免数据的冗余和重复建设,规避数据烟囱和不一致性。

建设统一的、规范化的数据接入层(ODS)和数据中间层(DWD和DWS),通过数据服务和数据产品,完成服务于公司的大数据系统建设,即数据公共层建设

指标种类:

名词术语 解释
维度 用来反映业务的一类属性,这类属性构成一个维度,如地理维度、时间维度
公共修饰词 指除了统计维度以外的公共限定词
其他修饰词 不便于约定的修饰词,比如“曝光人数超过100的“商品销量
动作 指企业的业务活动事件,如下单、支付、退款都是动作,也叫业务过程
维度属性 维度属性隶属于一个维度,如地理维度里面的国家名称、国家D、省份名称等
度量 用于衡量某个过程的单位,如人数、次数、件数、金额等
时间周期 用来明确数据统计的时间范围或时间点
原子指标 基于某一业务过程下的不可再拆分的指标,一般来说,原子指标=动作+度量
派生指标 公共修饰词+(维度属性)+原子指标+时间周期+(其他修饰词)
指标之间关系
指标设置方法

指标体系

1.组成体系之间的关系

原子指标、修饰类型及修饰词,直接归属在业务过程下,其中饰词继承修饰类型的数据域。

派生指标可以选择多个修饰词,修饰词之间的关系为“或“或者“且”,由具体的派生指标语义决定。

派生指标唯一归属一个原子指标,继承原子指标的数据域,与修饰词的数据域无关。

原子指标有确定的英文字段名、数据类型和算法说明;派生指标要继承原子指标的英文名、数据类型和算法要求。

2.命名约定

业务过程:具体业务过程中文即可。

原子指标:动作+度量,原子指标必须挂靠在某个业务过程下。

修饰词:时间周期修饰词参考常用表命名,其他修饰词按照实际规定来。

派生指标:时间周期修饰词+【其他修饰词】+原子指标。

操作细则:

1.派生指标的种类

事务型指标:是指对业务活动进行衡量的指标。例如新发商品数、重发商品数、新增注册会员数、订单支付金额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标。

存量型指标:是指对实体对象(如商品、会员)某些状态的统计。例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截至当前某个时间"。

复合型指标:是在事务型指标和存量型指标的基础上复合而成的。例如浏览UV-下单买家数转化率,有些需要创建新原子指标,有些则可以在事务型和存量型原子指标的基础上增加修饰词得到派生指标。

2.复合型指标的规则

比率型:创建原子指标,如CTR、浏览UV-下单买家数转化率、满意率等。例如,“最近1天店铺首页CTR",原子指标为 “CTR",时间周期为“最近1天”,修饰类型为“页面类型,修饰词为“店铺首页”。

比例型:创建原子指标,如百分比、占比。例如“最近1天无线支付金额占比",原子指标为“支付金额占比",修饰类型为终端类型”,修饰词为“无线”。

变化量型:不创建原子指标,增加修饰词,在此基础上创建派生指标。例如,“最近1天订单支付金额上1天变化量”,原子指标为“订单支付金额”,时间周期为“最近1天”,修饰类型为“统计方法",修饰词为“上1天变化量”。

变化率型:创建原子指标。例如,“最近7天海外买家支付金额上7天变化率”,原子指标为“支付金额变化率”,时间周期为“最近7天”,修饰类型为“买家地域”,修饰词为“海外买家”。

统计型(均值、分位数等):不创建原子指标,增加修饰词,在此基础上创建派生指标;在修饰类型“统计方法“下增加修饰词,如人均、日均、行业平均、商品平均、90分位数、70分位数等。例如,“自然月日均UV",原子指标为“UV",修饰类型为“统计方法”,修饰词为“日均"。

排名型:创建原子指标,一般为top_xxx_xxx,有时会同时选择rank和top_xxx_xxx组合使用。创建派生指标时选择对应的修饰词如下:

统计方法:比如降序、升序

排名名次:比如top100排名范围:比如行业、省份、一级来源

根据什么排序:比如搜索次数、PV

对象集合型:主要是指数据产品和应用需要展现数据时,将一些对象以k-v对的方式存储在一个字段中,方便前端展现统计方法:比如降序、升序

上下层级派生指标同时存在时:如最近1天支付金额和最近1天PC端支付金额,建议使用前者,把PC端作为维度属性存放在物理表中体现。

父子关系原子指标存在时:当父子关系原子指标存在时,派生指标使用子原子指标创建派生指标。如PV、IPV(商品详情页PV),当统计商品详情页PV时,优先选择子原子指标。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容