用户画像应用

今天参加了CCF TF组织的大数据系统与应用讲座,听了关于小米用户画像的介绍,简要做个笔记。

数据来源:

  • 手机、电视、生态链产品等式硬件
  • MIUI、互娱、云服务、金融等服务
  • 小米商城、小米之家、全网电商等

用户画像1.0

基于统计的用户标签

基本的方法就是预测+统计

基础属性

  • 性别/年龄
  • 学历/职业
  • 地域/语言
  • 设备数量/型号/系统
  • 帐号真实性/米粉

状态属性

  • 设备活跃状态
  • 在校/工作状态
  • 结婚/育儿状态
  • 有车/有房
  • 频繁出差

兴趣属性

  • 兴趣爱好(一级/二级)

金融属性

  • 收入/支出
  • 个人信誉/购买力
  • 消费(小米网/游戏/图书/主题/小米生活)

行为属性

  • App使用行为
  • 拨打电话(黄页)
  • 搜索和浏览行为
  • 视频/阅读行为

电商属性

  • 电商团购
  • 品牌偏好

SNS社交

  • SNS社交

注: 小米有多看阅读,所以会了解用户的内容相关兴趣。

性别的预测

大约有5%的准确数据(用户填写的,用户填写的准确率可能在90%?95%以上,总体上用户不是乱填的)。

通过安装APP、访问网站、搜索词等特征预测用户性别,在Recall为99%时Precision为83%,如果降低Recall可以提高准确率>90%。

用户真实性预测

根据帐号登录、手机使用、电商购买、米币支付、MI Cloud使用、注册码信息等特征使用规则划分可信用户,黄牛从20%下降到10%以内。用户真实性预测也用于金融信用以及各种活动中。误杀率高(在知乎上看到有人吐糟)。

用户画像2.0

基于行为的事实标签

通过规则提取事件

  • 搜索
  • 跑步
  • 拍照
  • 注册
  • 安装
  • 下载
  • 出行
  • 购物
  • 阅读
  • 通话
  • 游戏
  • 搬家
  • 重置
  • 视频
  • 交友
  • 打车

构建庞大标签体系

  • 聚合各业务已有标签
  • 尽量使用已有资源
  • 人工:例如构建售后相关标签

反馈定向

  1. 粗选一组用户,进行实验,得到成功率。
  2. 根据进行反馈的用户的行为,去挑选更多的用户进行实验,很大可能得到更高的成功率(目标用户群更精准)。
  3. 直到业务部门满意成功率。

路径分析

  • 用于用户真实性判定。
  • 用户的事件,进行频繁项集分析,并没有作用。
  • 路径分析可以起作用,有效降低误杀率(人工规则很难组合多个维度的规则,往往有一个维度超限就作出判定。路径分析可以考虑多种维度及参数的组合。)。
  • 使用路径分析生成一组组规则,人工审核规则,主要指标:错误率、覆盖率。

用户画像2.1

外延扩展

App2Vec

对50万App生成200维分布式表征。
用于性别预测,AUC达到85%准确率,与之前方法相当,但是非常省事。

反馈定向结果与APP分类结果都达到现有水平。

App打开预测

Top@5的准确率为83%,这是一个还不能使用的水平。
选取每个用户的Top5的应用作为预测,Top@5的准确率是60%。
Top@10的准确率大于90%,但是没有意义。

行为预测

小米应该在做虚拟个人助理产品。一方面像其他类似产品一样,可能采用一些规则的方式,比如知道用户下班了,空气质量差,从而提前打开空气静化器。另一方面,在尝试预测用户的下一个行为,例如时间+Context(回家模式、睡眠模式、阅读模式、通话模式)得到阅读0.7,外卖0.3,开灯0.1。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容