当我们从互联网时代逐渐步入大数据时代后,企业和消费者都迎来了一系列重大改变和重塑。其中最大的改变莫过于消费者的一切行为数据都将在企业面前可视化,但事实是海量数据赋予企业不一定都是可用信息。如何帮助企业从海量数据中快速,精准感知消费者的消费意向?其中最行之有效的方案就是构建清晰的用户画像。
何为用户画像
对用户进行数学建模,能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,为实现精准营销奠定了基础。之所以说用户画像是一种模型,是因为它是通过分析挖掘用户尽可能多的数据信息得到的,它从数据中来,但对数据做过了抽象,做过概念泛化,比数据要高。由于对数据做了抽象化处理,所以其准确性不得而知,例如:我们称宋代高俅同志为足球爱好者,对不对他自己也拿捏不准;所以讨论此类模型类标签具体的准确性是没有意义的,一切还得看对业务的提升情况如何。
何为标签
标签是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,标签是基于用户的行为数据和消费数据进行统计计算得到的,包好用户的各个维度,其值是准确的,并且为用户画像的刻画提供了数据基础。
何为标签系统
用户所有的特征集合成为标签系统。标签系统两个视角:一“化整为零”,每个标签都规定了我们观察、认识和描述用户的一个角度;二“化零为整”,标签系统是一个整体,各个维度不孤立,并且标签之间有联系。标签系统包含标签以及通过数据挖掘和数学建模构建的用户画像特征。
如何搭建标签系统
在广告推荐,搜索推荐和电商精准营销等业务领域构建标签系统主要采用以下三种方法。
1.结构化的标签系统
简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告主开喷时比较好用。性别、年龄这类人口属性标签,是最典型的结构化系统。下图就是Yahoo!受众定向广告平台采用的结构化标签系统:
2.半结构化的标签系统
在用于效果广告时,标签设计的灵活性大大提高了。标签系统是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列系统,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签系统:
3.非结构化的标签系统
非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词。
互金消金领域标签系统
在互金和消金风控领域其数据源主要是用户的信贷申请,信贷履约,理财等金融行为数据;所以需要以业务梳理的角度去构建标签系统,其构建的标签系统可以分为三类:基础标签,模型标签,预测标签三类。其中基础标签是模型标签和预测类标签的基础,模型标签通过“模型+规则”统计分析得到模型标签,预测标签通过模型预测得到。其系统如图所示:
基础标签特点
主要是历史行为数据和消费数据的清洗统计,其本身不需要模型与算法,实现简单,但规模需要不断基于业务补充与丰富。主要包含自然属性类标签(性别、年龄段等)、业务类标签(现金贷,消金和卡代偿等)、统计类标签(求和,平均,最大,最小等)等。
模型标签特点
对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。
预测标签特点
基于用户的属性、行为、信令、位置和特征,通过机器学习、深度学习以及神经网络等算法进行用户行为预测,包含借贷、违约、产品迁移、流失等行为。
结语:构建合理的标签系统不是一次性工程,它需要不断地被业务滋养,这其中,除了业务的输入以及数据的支撑外,要想快速建立一套科学的标签系统,还需要丰富的技术经验以及智能的工具或平台来提供助力,而行列秩则专注于为信托机构提供专业的数据技术及"数据中台"开发服务,有能力帮助企业最大限度地缩短“读懂用户“这个目标的实现过程。