0-1搭建用户画像系统的设计思路


一、需求目的

①、商城已上线2周年,已有10万+在售物品。数据仓库中积累着大量的业务数据、日志数据及埋点数据。如何充分挖掘沉淀在数据仓库中的数据的价值,有效的支持用户画像的建设,成为当前的重要工作。

②、在保证用户规模不断增长的目标下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,及时采取运营策略换回用户。

二、产品结构

三、用户画像系统搭建流程

目前团队已经搭建了比较成熟的数据仓库。也就是说已经有结构化的、清晰的用户属性、用户行为相关数据。在此基础上,搭建用户画像系统,需要:

四、数据建模

对人、货、场进行分析,对用户个体的性质和特征做出概括,形成相应的用户属性标签、用户行为标签后。才可以开始建模。建模需要分别从定性、定量,两个方面入手:

定性:在从已有数据中心,选择特征。假设这些特征与你要预测的值有一个关系。这个关系就是一个原始的模型。

定量:确定模型中涉及到的所有未知系数

模型计算完成后,需要计算模型的置信度。此时根据测试数据(可以是团队内部测试、灰度测试等方式),来判断模型计算的结果,与预期是否相符。如果相符,就可以用这个模型来预测用户喜欢什么。如果与预期不相符,那么久需要重复上述过程

【举例】

比如商城系统中,有以下数据项

用户忠诚度指标(L),与用户活跃度、购物车商品数、收藏数、下单数、在线时长的用户行为指标有一定的关系。将这5项数据指标的熵权值,定义为用户忠诚度指标,可以用以下公式表示:

其中a表示上表中A2-A6的归一化值,归一化计算公式如下

w表示权重。权重系数计算公式如下

其中,e为行为数据信息熵,计算公式如下

最终计算所有的用户的指标L后。例如可以取前25%为高忠诚用户,25-50%为普通忠诚用户,剩余为低忠诚用户。取值范围可以根据业务实际情况调整。

另外,由于权重系数,有可能随时间的增加而衰减。所以如果需要,还需要定义衰减因子r。加入衰减因子后,标签权重=衰减因子*行为权重

五、梳理用户画像维度

设计用户画像维度时,建议使用MECE(Mutually Exclusive Collectively Exhaustive)准则。也就是对于一个重大的议题,能够做到不重叠、不遗漏的分类,而且能够借此有效把握问题的核心,并成为有效解决问题的方法。

比如初步搭建用户画像维度,可以参考下图

上图为商城系统,初步的用户画像维度。图中的数据,按照获取的方式,可以分为:统计类标签、规则类标签、挖掘类标签。

统计类标签:这类标签是最为基础也最为常见的标签类型,例如对于某个用户来说,他的性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费类数据中统计得出。该类标签构成了用户画像的基础;

规则类标签:该类标签基于用户行为及确定的规则产生。例如对平台上“消费活跃”用户这一口径的定义为近30天交易次数>=2。在实际开发画像的过程中,由于运营人员对业务更为熟悉、而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则确定由运营人员和数据人员共同协商确定;

挖掘类标签:该类标签通过数据挖掘产生,应用在对用户的某些属性或某些行为进行预测判断。例如根据一个用户的行为习惯判断该用户是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

六、形成初步用户画像

基于用户画像数据,可以使运营人员、营销人员,有更好的用户认识,带来更佳的用户服务质量,实现精准运营、精准营销。

设计用户画像的可视化展现时,可以使用以下工具:

其中tableau、powerbi等自助式数据分析工具,可以让没有编程经验的业务人员、运营人员等进行自我数据分析,不需要依赖IT人员

七、评估用户画像效果

在初步形成了用户画像后,并不能直接交给运营、业务人员实际使用。还需要评估用户画像的准确性。评估方式主要分为3种:逻辑验证、A/B test、用户回访。

逻辑验证:也叫做交叉验证。在完整的用户画像标签体系中,一些标签往往会存在一些相关性。比如用户的累计在线时长越长,订单量通常会越高。比如购买3C产品的用户群中,男性用户数通常大于女性用户数。另外,如果公司购买了第三方机构的数据,也可用于交叉验证

A/B test:也叫做灰度测试。以上述的忠诚度为例。保证对照组、实验组的流量相同。对实验组的用户,进行提升忠诚度的运营策略(促销活动、积分奖励等)。如果实验组的用户,忠诚度相比对照组用户,有一定提升,则可以认为用户画像比较精确。

用户回访:最朴实的评估方法。比如用户画像系统,定义了10万用户为低忠诚度用户。此时从中随机抽取1000人,交给客服,进行回访。根据回访结果,判断用户画像结果是否准确。甚至可以对回访结果进行文本挖掘,形成词云,查看消极词的占比。

八、总结

当公司业务规模,用户体量上升到一定量级。业务、运营团队,往往会提出对用户精准运营的想法。此时就需要用户画像系统,在支持业务运营的同时,也可以帮助产品经理更好的了解用户。

0-1搭建用户画像系统。需要在已有比较成熟的数据仓库的前提下 进行:

1、数据建模:根据业务模式,设计相应的数据模型

2、梳理用户画像维度:不重叠、不遗漏的梳理用户标签体系

3、形成初步用户画像:可以使用tableau、powerBI、echarts等多种工具,生成可视化的用户画像

4、评估用户画像效果;通过逻辑验证、A/B测试、用户回访等方式,验证用户画像系统中的标签是否准确

5、根据评估效果,持续优化用户标签系统

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342