如何构建标签系统

       当我们从互联网时代逐渐步入大数据时代后,企业和消费者都迎来了一系列重大改变和重塑。其中最大的改变莫过于消费者的一切行为数据都将在企业面前可视化,但事实是海量数据赋予企业不一定都是可用信息。如何帮助企业从海量数据中快速,精准感知消费者的消费意向?其中最行之有效的方案就是构建清晰的用户画像。

何为用户画像

       对用户进行数学建模,能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,为实现精准营销奠定了基础。之所以说用户画像是一种模型,是因为它是通过分析挖掘用户尽可能多的数据信息得到的,它从数据中来,但对数据做过了抽象,做过概念泛化,比数据要高。由于对数据做了抽象化处理,所以其准确性不得而知,例如:我们称宋代高俅同志为足球爱好者,对不对他自己也拿捏不准;所以讨论此类模型类标签具体的准确性是没有意义的,一切还得看对业务的提升情况如何。

何为标签

       标签是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,标签是基于用户的行为数据和消费数据进行统计计算得到的,包好用户的各个维度,其值是准确的,并且为用户画像的刻画提供了数据基础。


用户各个维度的标签

何为标签系统

       用户所有的特征集合成为标签系统。标签系统两个视角:一“化整为零”,每个标签都规定了我们观察、认识和描述用户的一个角度;二“化零为整”,标签系统是一个整体,各个维度不孤立,并且标签之间有联系。标签系统包含标签以及通过数据挖掘和数学建模构建的用户画像特征。

如何搭建标签系统

       在广告推荐,搜索推荐和电商精准营销等业务领域构建标签系统主要采用以下三种方法。

1.结构化的标签系统

       简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告主开喷时比较好用。性别、年龄这类人口属性标签,是最典型的结构化系统。下图就是Yahoo!受众定向广告平台采用的结构化标签系统:


Yahoo!广告平台标签系统

2.半结构化的标签系统

       在用于效果广告时,标签设计的灵活性大大提高了。标签系统是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列系统,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签系统:

Bluekai标签系统

3.非结构化的标签系统

       非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词。

互金消金领域标签系统

       在互金和消金风控领域其数据源主要是用户的信贷申请,信贷履约,理财等金融行为数据;所以需要以业务梳理的角度去构建标签系统,其构建的标签系统可以分为三类:基础标签,模型标签,预测标签三类。其中基础标签是模型标签和预测类标签的基础,模型标签通过“模型+规则”统计分析得到模型标签,预测标签通过模型预测得到。其系统如图所示:

标签系统示例

 基础标签特点

       主要是历史行为数据和消费数据的清洗统计,其本身不需要模型与算法,实现简单,但规模需要不断基于业务补充与丰富。主要包含自然属性类标签(性别、年龄段等)、业务类标签(现金贷,消金和卡代偿等)、统计类标签(求和,平均,最大,最小等)等。

模型标签特点

      对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

预测标签特点

       基于用户的属性、行为、信令、位置和特征,通过机器学习、深度学习以及神经网络等算法进行用户行为预测,包含借贷、违约、产品迁移、流失等行为。

结语:构建合理的标签系统不是一次性工程,它需要不断地被业务滋养,这其中,除了业务的输入以及数据的支撑外,要想快速建立一套科学的标签系统,还需要丰富的技术经验以及智能的工具或平台来提供助力,而行列秩则专注于为信托机构提供专业的数据技术及"数据中台"开发服务,有能力帮助企业最大限度地缩短“读懂用户“这个目标的实现过程。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容

  • 1. 什么是用户画像? 2. 用户画像的四阶段 用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的...
    笔名辉哥阅读 13,667评论 0 70
  • 概述及标签体系搭建 1 概述 随着信息技术的迅速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,愈发带来很大...
    JinkeyAI阅读 22,747评论 10 241
  • 核心诉求: 写作者:分享知识、获得关注——让用户文字迅速被潜在用户知晓是关键(投稿) 阅读者:获取信息——保证高质...
    拾零阅读 312评论 0 2
  • 已经四月份了 转眼春天就要溜走了 可是我却好不舍。 春天作为四季的开头,总是给人一种充满希望的感觉。鸟语花香...
    RY_媛阅读 198评论 0 0