黑五数据——基于Excel分析

大数据分析已经迅速成为数据驱动业务的一个组成部分,并在使品牌和企业更容易在用户运营中发挥重要作用。企业建立的内容传播和推广活动受到来自各种渠道的影响越来越大,尤其是关于其受众、其用户的在线行为和个人喜好的数据洞察。本文尝试我从kaggle大数据平台上下载了Black Friday的销售数据,对其进行分析,以挖掘出对该电商企业制定促销策略有价值的信息。

一、电商数据分析指标及数据分析方法
1.电商数据分析指标在知乎上找到了一篇详细的文章,想借此引用猕猴桃电商数据分析指标总结
2.数据分析方法也同样引用猕猴桃常用数据分析方法及模型
具体自我总结等学完python,再总结《数据化管理》。
二、业务理解并提出问题

image.png

前期思考借用了猪可飞大佬的一些思考,基于框架提出问题,
(1)根据消费者的性别比例、年龄分布、职业分布、所在城市居住时间分布和婚姻状况,商家该怎样针对顾客发促销广告
(2)销售额最高的产品类别和产品是什么?销量最高的产品类别和产品是什么?
(3)各城市的产品销售额和销量是怎样的?
(4)找出销售数量最高的TOP10商品,来分析最受欢迎的商品有什么特点?
(5)不同居住年数的购物习惯是怎样的?
二、这次数据集中的数据量共计有657677条。一共包含了12个字段,如下:
User_ID:用户编码
Product_ID:产品编码
Gender:性别(F-女性,M-男性)
Age:年龄(分为7个年龄段:017、1825、2635、3645、4650、5155、55+)
Occupation:职业(分为21个类别:0-20)
City_Category:城市类别(分为3个类别:A、B、C)
Stay_In_Current_City_Years:在当前城市的居住年数(分为5个类别:0、1、2、3、4+)
Marital_Status:婚姻状况(0-未婚,1-已婚)
Product_Category_1:商品所属分类1,不可为空
Product_Category_2:商品所属分类2
Product_Category_3:商品所属分类3
Purchase:购买金额(美元)
三、数据清洗
1-列名重命名
image.png

2-选择子集
根据要分析的问题,将不会用到的列进行隐藏。可以将商品所属分类2还有商品所属分类3进行隐藏。
3-删除重复值
(1)在分析有关销售金额时,由于同一个用户可以买不同的产品,同一个产品可以被不同的用户购买,所以用户对应的唯一值——用户编码,和产品对应的唯一值——产品编码都不能作为本表的唯一列去判断是否有重复项,新建一个辅助列,将用户编号和产品编号放在一起,去判断购买信息是否有重复列。
选择整个区域——数据-删除重复值——取消全选——选择辅助列——确定。结果显示未发现重复值。
(2)在分析消费者时,由于同一个用户可以买不同的产品,所以应检查用户编号是否有重复,删除重复值。
image.png

4-缺失值处理
分析需要用到的列无缺失值,计数均为537578。
5-一致化处理
为了方便分析和阅读,将表中性别那一列中的F全部替换为女,M全部替换为男。将表中婚姻那一列中的替换“0”为“未婚”,“1”为“已婚”。
6-数据排序
对该数据检查,该数据集默认以用户ID从小到大排序,其他分析需要用到的列无需特定排序,因此未进行数据重新排序。
7-异常值处理
对该数据检查,分析需要用到的列均无异常值,无需异常值处理。
四、数据分析
1、通过数据透视表找出消费者的性别比例、年龄分布、职业分布、所在城市居住时间分布和婚姻状况。
(1)消费者的性别比例
image.png

从性别看,消费者中大部分为男性,男性人数是女性人数的两倍多。
(2)消费者的年龄分布
image.png

从年龄看,消费者的年龄集中在18岁至45岁,以中青年为主。在七个年龄分段中, 26岁至35岁的消费者为购买该产品的主力,大约占全部购买该产品类别的消费者的40%。
(3)消费者的职业分布
image.png

从职业看,消费者从事职业4、职业0和职业7的人数较多,分别占全部消费者的12.56%,11.68%和11.36%。其他职业占比均低于10%。
(4)消费者的所在城市居住时间分布
image.png

从消费者所在城市居住时间看,居住时间满一年且不足两年的消费者为“黑五”消费的主力军,占全部消费者的35.41%。
(5)消费者的婚姻状况
image.png

从消费者的婚姻状况看,未婚消费者占全部消费者的58.00%,接近六成。
通过对消费者的性别、年龄、职业、所在城市居住时间、婚姻状况这5个角度分析得出,从黑五中的消费者性别分析得出71.72%为男性,23.21%为女性。消费者主力的年龄范围在26-35岁这个范围,处在这个年龄段的消费者大都数已经工作了,能够经济独立了,其次是36-45岁和18-25岁之间的消费团体。从消费者的职业分析,职位是4,0,7的消费者的消费金额都在10%以上,可以判断从事这几个行业的收入应该不错。
在商品分类1对客户属性分析
性别
image.png

年龄
image.png

职业分布
image.png
由于职业太多,只选取了消费金额排名前15的职业
城市
image.png

居住年数
image.png

婚姻
image.png

通过消费者性别、年龄、居住年数、婚姻以及职业和产品购买金额之间的百分百排名,发现商品分类1中的第1、5、8这三种类型的产品的购买金额都在总体购买金额的10%以上,说明这3类产品的需求量很大。其中第1类产品一直销售金额排名第一,而第5、8这两类产品由于消费者的年龄和职业不同,排名会发生变化。商家可以好好开拓这3类产品,为消费者提供更好的商品。同时有些销量特别低的产品类目,商家可以根据自己的需求决定是否还需要保留。
2、通过数据透视表找出销售额最高的产品类别和产品,以及销量最高的产品类别和产品。
(1)销售额最高的产品类别
image.png

从上图可以看出,销售额最高的是产品类别1,销售额为1,882,666,325美元。
(2)销售额最高的产品
image.png

从上图可以看出,销售额最高的产品是P00025442,销售额为27,532,426美元。
(3)销量最高的产品类别
image.png

从上图可以看出,销量最高的是产品类别5,销量为148,592。
(4)销量最高的产品
image.png

从上图可以看出,销量最高的产品是P00265242,销量为1,858。
3、通过数据透视表找出各城市的产品销售额和销量。
(1)各城市的产品销售额
image.png

从上图可以看出,销售额最高的为城市B,销售额为2,083,431,612美元;其次为城市C,销售额为1,638,567,969美元;最后为城市A,销售额为1,295,668,797美元。
(2)各城市的产品销量
image.png

从上图可以看出,销量最高的为城市B,销量为226,493;其次为城市C,销量为166,446;最后为城市A,销量为144,638。
4、找出销售数量最高的TOP10商品,来分析最受欢迎的商品有什么特点?
根据产品编号,购买金额两个字段绘制出数据透视表,然后根据数据透视表制作如下的表格。
image.png

从中可以看出购买金额排前10的产品,其中有7个都在产品所属分类1中的第一个档次中,这10中产品在总的购买金额中都占了0.44%以上。商家可以根据这几类产品分析推出更加符合消费者偏好的产品,也可以根据这些产品找出和它们相关联的产品。
5、不同居住年数的购物习惯是怎样的?
image.png

image.png

根据消费者的居住年数与购买金额的百分百得出,消费主力为居住年数是1年的人,这类人往往大多数可能是居住稳定了,可以购买自己想要的东西了。消费金额最少的是居住年数为0的,这可能是才到这个城市几个月,只购买自己的必需品。
根据消费者居住年数和产品类别的分析得出,1、5、8这三类产品仍然是热销品,可能是和生活衣食住行息息相关的产品。后期商家可以根据不同居住年数,推荐不同的商品。比如居住1年的,可以推荐 家居品,比如洗衣机等;居住2年以上的可以推荐儿童用品等等。
五:结论
通过数据分析可得:商家应把主要精力放在1、5、8这三类商品上面,优化提供更多好的商品,可以真的居住年数在一年以上两年以上的,年龄在26-35,以及职位是4,0,7的这些顾客上进行精准营销,提高企业营业收入增长。
注意:1.
image.png

image.png

注意透视表计数项和求和项之间的不同
2.数据透视表占比的使用方法
3.注意数据删除重复值

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,723评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,080评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,604评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,440评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,431评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,499评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,893评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,541评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,751评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,547评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,619评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,320评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,890评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,896评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,137评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,796评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,335评论 2 342

推荐阅读更多精彩内容