某电商运营类分析

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.style.use('ggplot')
plt.rcParams["font.sans-serif"]='SimHei'#解决中文乱码
plt.rcParams['axes.unicode_minus'] = False#解决负号无法正常显示的问题
# 数据读取
df = pd.read_excel(r"C:\Users\wxw\Downloads\online_retail_II.xlsx",sheet_name='Year 2010-2011',dtype=str)
df.head()
image.png
# 查看数据情况
df.info()
image.png
#重复值查看
a1 =df.shape[0]
df.drop_duplicates(inplace =True)
a2 =df.shape[0]
print('删除后记录量:',a2,'删除记录量:',a1-a2)
image.png
#充值索引
df.reset_index(drop =True,inplace =True)
# 缺失值处理
df.isnull().sum()
image.png
# 一致化处理
df['InvoiceDate'] = pd.to_datetime(df['InvoiceDate'],errors = 'coerce')
df['Quantity'] = df['Quantity'].astype('int32')
df['Price'] = df['Price'].astype('float')
df['Date'] = pd.to_datetime(df['InvoiceDate'].dt.date,errors = 'coerce')
df['Month'] = df['InvoiceDate'].astype('datetime64[M]')
df['Sales_volume'] = df['Quantity']*df['Price']
df.describe()
image.png
#删除 单价和数量为负值的数据
df = df[(df['Quantity'] > 0) & (df['Price'] > 0)]
df.describe()
image.png
# 查看现在数据表形式
df.head()
image.png
day =df.groupby('Date').aggregate({'Quantity':"sum",'Sales_volume':"sum"})
day.plot(figsize = (15,8))
plt.xlabel('每日')
plt.ylabel('数量')
plt.title('日度销售金额和单量趋势图')
image.png
# 取最高一周数据查看原因
day1 =day['2011-11-01':'2011-12-09']
day1.plot(figsize = (15,8))
plt.xlabel('日期')
plt.ylabel('数量')
plt.title('11月及12月销售金额和单量趋势图')
image.png
# 查看当天发生了什么
df[df.Date == '2011-12-09'].sort_values(by = 'Sales_volume', ascending = False).head(10)
image.png

有个大客户买了80995,这是导致数据异常的原因

month =df.groupby('Month').aggregate({'Quantity':"sum",'Sales_volume':"sum"})
month.plot(figsize = (15,8))
plt.xlabel('每月')
plt.ylabel('数量')
plt.title('月度销售金额和单量趋势图')
image.png
order_d = df.groupby('Invoice').aggregate({'Quantity':"sum",'Sales_volume':"sum"})
order_d.describe()
image.png
order_d['Quantity'].hist(bins = 100, figsize = (15, 8), color = 'r')
plt.title('订单量分布频率图')
plt.ylabel('频率')
plt.xlabel('订单量')
image.png
order_d[order_d.Quantity < 5000]['Quantity'].hist(bins = 100, figsize = (15, 8), color = 'r')
plt.title('订单量分布频率图(小于5000)')
plt.ylabel('频率')
plt.xlabel('订单量')
image.png
order_d['Sales_volume'].hist(bins = 100, figsize = (15, 8), color = 'r')
plt.title('销售金额分布频率图')
plt.ylabel('频率')
plt.xlabel('销售金额')
image.png
order_d[order_d.Sales_volume < 2000]['Sales_volume'].hist(bins = 100, figsize = (15, 8), color = 'r')
plt.title('销售金额分布频率图(小于2000英镑)')
plt.ylabel('频率')
plt.xlabel('销售金额')
image.png
plt.figure(figsize=(15,8))
plt.scatter(order_d['Quantity'], order_d['Sales_volume'], color = 'r')
plt.title('销售金额与订单量散点图')
plt.ylabel('销售金额')
plt.xlabel('订单量')
image.png
# 筛去商品件数在20000及以上的订单
plt.figure(figsize=(15,8))
plt.scatter(order_d[order_d.Quantity < 20000]['Quantity'], order_d[order_d.Quantity < 20000]['Sales_volume'], color = 'r')
plt.title('销售金额与订单量散点图(20000以下)')
plt.ylabel('销售金额')
plt.xlabel('订单量')
image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,802评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,109评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,683评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,458评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,452评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,505评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,901评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,550评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,763评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,556评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,629评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,330评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,898评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,897评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,140评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,807评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,339评论 2 342

推荐阅读更多精彩内容

  • 今天,我终于和笑笑在一起了,笑笑是我姐姐家的孩子,她比我大三岁,但是,我们是最好的朋友,我有一段时间看不到她就想,...
    曹喆120423阅读 165评论 0 0
  • 就算没有人听到你的哭喊, 只能夜夜蜷缩在角落抽噎, 也请不要认为自己就此, 被世界的巨轮抛弃碾压。 地平线的彼端总...
    嗯_5d65阅读 177评论 0 1
  • 最近几天临汾天气不错,雾霾大大减少,我的心情也像近几天的天气一样,甚是明朗!近期好多客户朋友来到理财室,都会问我...
    梁志伟的小课桌阅读 1,513评论 7 8
  • ,我一个非常普通的女孩。 刚刚经历过高考 没有达到预期,但还是上了大学 但是我不知道为什么 在这漫长的假期间,我很...
    soSonySony阅读 265评论 0 1