利用SQL进行淘宝用户行为分析

目录:


一、提出问题:

本次分析的目的是想通过对淘宝用户行为分析,解释并改进以下问题:

1.分析用户使用淘宝中的常见电商分析指标,建立用户行为转化漏斗模型,确定各个环节的流失率,找到需要改进的环节;

2.研究用户在不同时间维度下的行为规律,找到用户的时间活跃规律,在用户活跃时间点推出相应营销策略;

3.找到用户对不同种类商品的偏好,找到针对不同商品的营销策略;

4.对用户进行分层,对不同类型的客户制定不同的维护策略。

二、理解数据:

阿里巴巴天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1

本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有约一百万随机用户的所有行为。

数据集大小情况为:用户数量约100万(987,994),商品数量约410万(4,162,024),商品类目数量约1万(9,439),用户行为数量约为1亿条(100,150,807)

本次研究抽样选取了402480条行为记录,包含了3929个用户,205745个商品,34850个商品类目。

三、数据清洗:

3.1 创建表格,导入数据

用SQL创建表格userbehavior,导入淘宝用户行为数据。


3.2 删除重复值


数据集中无重复数据


3.3 缺失值处理


各个字段均为402480条,无缺失值。 

3.4 时间格式转换



3.5 过滤异常值

由于数据集时间范围为2017-11-25至2017-12-3,因此需要对不在该时间范围内的异常数据进行过滤。总计过滤掉172条记录


3.6 数据统计


对清洗后的数据进行统计,展示了2017-11-25至2017-12-03期间的402480条行为记录,

包含了3929个用户,205745个商品,34850个商品类目。

产生了361533次访问,10109次收藏,22354次加入购物车及8312次购买记录。



四、数据分析:

4.1常见电商指标分析

4.1.1 UV、PV、UV/PV


访问用户总数(UV):3929

页面访问总量(PV):361533

9天时间内平均每人页面访问量(UV/PV):约为92次

4.1.2 复购率

复购率定义:在某段时间内重复消费用户(消费两次及以上的用户)在总消费用户中占比


复购人数合计1834,总计购买人数2727,复购率67%,反映淘宝的用户忠诚度较高。

4.1.3 跳失率

统计结果表明,9天时间内,没有一名用户仅浏览一次页面就离开淘宝,跳失率为0。反映出商品或者商品详情页的内容对于用户具有足够的吸引力,让用户在淘宝驻留。

4.2 用户行为转化漏斗模型分析


用户行为类型说明 :

pv 商品详情页pv,等价于点击

fav 收藏商品

cart 将商品加入购物车

buy 商品购买


本数据内产生了361533次点击,10109次收藏,22354次加入购物车、8312次购买行为。

漏斗模型制作:

商品详情页—加入购物车—支付订单

4.2.1用户总行为(PV)的转化漏斗


从浏览商品详情页PV到加入购物车只有6.2%的转化率,可以确认加入购物车环节是夹点位置,该环节较低的转化率不利于激活用户。

4.2.2 独立访客(UV)的转化漏斗


从浏览商品详情页PV到加入购物车只有6.2%的转化率,但从独立访客转化来看,有75.6%的访客都有将商品加入购物车的行为,说明用户在购买商品前会大量的去点击浏览商品详情页。

支付订单用户数占浏览商品详情页用户数的69.5%,反映淘宝APP用户购买转化率较高,即淘宝APP上的商品能满足绝大部分用户的购买需求。

4.3 从时间维度分析用户行为


4.3.1每日用户行为分析



通过每日用户行为数据变化曲线可以看出:11月25日至12月1日,数据波动变化范围很小,在12月2-3日(周末),各项数据指标明显上涨,高于前7天的各项数据指标。由于在上一个周末(11月25-26日)的各项数据指标并未存在明显涨幅,因此推测在12月2-3日数据指标上涨可能与淘宝双12预热活动相关。

4.3.2 每时用户行为分析



通过每时用户行为数据变化曲线可以看出:在凌晨2-6点左右,各项数据指标进入低谷期;在6-10点之间,数据呈现一上升趋势;在20-23点间,各数据指标呈现一个大高峰,并且在22点左右达到每日数据最大峰值,数据的变化趋势比较符合正常用户的作息规律。

4.4 从商品维度分析用户行为

4.4.1 商品销量排行榜前10


4.4.2 商品浏览量排行榜前10


4.4.3 对销量前10与浏览量前10的商品关联


浏览次数前列的商品没有进入销量前10,高曝光率商品转化率低。

4.4.4 统计商品购买次数



根据不同销量对应商品量数据,在被下单的7549件商品中,只购买一次的商品有6939件,占下单总商品的91.9%。

4.5 基于RFM模型进行用户分层

由于不同用户对公司带来的收益差别很大,而且根据二八定律20%的做有价值用户能带来80%的收益,因此需要对用户进行价值评价,对不同类型用户采用不同的营销策略。

R-Recency(最近一次购买时间)

R指用户上一次消费的时间,上一次购物时间距今最近的顾客通常在近期响应营销活动的可能性也最大,对于APP而言,很久没有购物行为可能意味着用户放弃了APP的使用,重新唤起用户也需要更多的成本。

F-Frequency(消费频率)

F指用户在某段时间内的购物次数,消费频率越高意味着这部分用户对产品的满意度最高,用户粘性最好,忠诚度也最高。

M-Money(消费金额)

M指用户在某段时间内的购物金额,这也是为公司带来价值的最直接体现,而消费金额较高的用户在用户总体中人数较少,却能创造出更多价值,是需要重点争取的对象。

由于本数据不包含订单金额,故本次分析中不考虑M维度,只分析R、F两个维度,对两个维度的指标进行分级打分,最终按照综合得分对用户分层。




根据RF_Score值,对用户进行分层:划分为2-3分,4-5分,6-7分,8-9分四个等级,分别对应易流失用户、挽留用户、发展用户、忠诚用户。




从用户分层结果可以看到:

重点挽留用户的比例最高,而且这部分客户给平台带来的潜在价值也很大,应该对这部分用户进行定期上新提醒、价格激励、订单搭配推荐等措施,留住用户并提高其消费频次;

易流失用户占比也相对较高,这部分客户可能已经找到替代品或对该公司产品不感兴趣了,可采取价格激励、发放优惠券等方式进行流失召回;

忠诚用户占比最少,这部分用户属于平台的 高价值用户,需要制定相应的运营策略来保持用户粘性;

重点发展用户占比也较低,对这部分用户发送提醒或促销活动邮件、促进其消费频次。

五、结论

1. 通过0跳失率可以看出淘宝的商品对用户有足够的吸引力,淘宝用户的忠诚度较高,复购率高达67%。从浏览商品详情页PV到有购买意向仅有6.2%的转化率,这一环节是指标提升的重点环节,尽量做到精准推荐,减少用户寻找信息的成本。建议优化电商平台的搜索匹配度和推荐策略,向用户推荐喜好相关的商品,优化商品搜索的准确度和聚合能力,对搜索结果排序优先级进行优化。

2. 通过时间维度可以看出,2点-6点是一个明显的消费低谷,绝大多数人在这个时段休息;6点-10点是第一个显著增长区间,部分消费者在醒来后起床前、上班途中浏览淘宝;10点—18点,日活量大体平稳,临近18点时有所下降;20-23点,是第二个显著增长区间,且起点较高,大约在22点达到了一天流量的峰值。可以说,20-23点是电商的黄金时段,是获客、激活、留存、变现和推荐的关键时期。建议营销团队和技术团队的服务精力集中在这个黄金时段。

3. 浏览次数前列的商品没有进入销量前10,在销量榜单中并没有看到浏览量第一和第二的商品, 说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。其原因是否是广告的投放人群或者商品的推送目标有问题,并没有获取到对应商品的目标用户;是否是商品的定价与定位的原因,价格太贵且不符合主流消费群体的胃口;是否是商品详情页的图片、描述以及商品的评价较差;是否是客服的服务不到位、APP操作更新流程复杂等因素。

4. 淘宝平台商品售卖主要是依靠长尾商品的累计效应,并非爆款商品的带动。长尾效应的确能带来一部分收益,但是,繁多的种类对于商家来说其实是一种经营负担,成本也较高。二八定律告诉我们,商家其实可以通过打造爆款商品来获利。打造爆款商品具体的建议是:品控上提高产品质量,宣传上增大力度,展现上突出产品优势。

5. R和F评分都很高的用户是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,综合评分大于4的用户属于活跃的成熟客户,可以积极推送营销信息,对于综合评分为4~2的用户,可以通过传递新品,通知店铺活动信息,对于评分小于2的用户,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343