统计学-方差分析实践

题目
数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:

1、每个地区间的销售量是否相同?

2、不同月份的销售量是否相同?

3、不同时间与地区的销售量是否相同?

       date     A     B     C     D
0 2019-12-01  8087  5923  9299  6287
1 2019-12-02  7851  5617  8984  6078
2 2019-12-03  4679  5481  8461  6735
3 2019-12-04  4296  6473  8407  1749
4 2019-01-04  7875  1688  5371  6377
5 2019-01-05  7271  6078  5923  6161
6 2019-01-06  9299  6735  5617  6861
7 2019-01-07  1749  2588  8407  1782
8 2019-03-08  3196  2595  9299  6820
9 2019-03-09  1220  1132  9627  6591

1、每个地区间的销售量是否相同?
用单因素方差分析,先假设,再构造统计量,最后进行决策
(1)假设H0,即假设样本A,B,C,D的均值相同,不同地区无显著性影响。H1:样本A,B,C,D均值不全相等,有显著性影响。
​(2)构造统计量,因素为地区,水平为4,因变量为销售量。

import numpy as np
import scipy.stats as stats
import pandas as pd
#读取数据
data=pd.read_excel("/Downloads/1销售数据.xlsx")

print(data.describe())  #统计数量、均值、标准差、上下四分位
print(data.mean().sum()/4)  #输出对应的总体均值
                A            B            C            D
count    11.000000    11.000000    11.000000    11.000000
mean   5150.454545  4329.909091  7457.909091  5588.727273
std    3049.346368  2079.064090  2234.142809  1912.142311
min    1132.000000  1132.000000  2642.000000  1749.000000
25%    2472.500000  2591.500000  5770.000000  6056.500000
50%    4679.000000  5481.000000  8407.000000  6287.000000
75%    7863.000000  6000.500000  9141.500000  6663.000000
max    9299.000000  6735.000000  9627.000000  6861.000000
5631.75

总平方和SST=95533231.1875+61867762.1875+86597368.1875+36583242.6875
组间平方和SSA=57894573.5196352
组内平方和SSE=222687030.727273
MSA=SSA/(4-1)=19298191.17 , MSE =SSE/(N-K)=31812432.96,
检验统计量F=MSA/MSE=0.606624184 , 在给定显著性水平a=0.05,在F分布表中查找分子自由度df1=4-1=3,分母自由度df2=n-k=11-4=7,相应的临界值Fa(3,7)=4.347,F<Fa 则不拒绝原假设H0,即认为各地区对销售量影响不显著。
问题2. 不同月份销售量不同?
1)假设H0:各月的均值相等,即各个月份对销售量无显著影响;H1:各个月份均值不完全相同,即不同月份对销售量有显著影响。

(2)构造和计算统计量
(所有数据按照月份分组,2019年3月数据少4行,因此保留前12行分析数据)
1)计算总体均值:5898.5,水平为3
2)总平方和SST=205887565
3)组间平方和SSA=39687746
4)组内平方和SSE=SST−SSA=205887565−39687746=166199819
5)MSA=SSA/(3-1)=19843873
MSE=SSE/(n-k)=SSE/(12-3)=18466646.56
6)F=MSA\MSE=1.074579131
(3)决策分析,F<Fa=Fa(2,9)=4.256,不拒绝原假设,即各个月份影响不显著。

问题3. 不同时间与地区的销售量是否相同?
这里按照无交互作用的双因素方差分析方法
(1)假设(2)构造统计量和计算(3)决策

(1)行因素:H0:假设日期对销售量无显著影响;H1:日期对销售量有显著影响;
列因素:H0:假设地区对销售量无显著影响H1:地区对销售量有显著影响列因素。
(2)构造统计量并计算:




(3)从上表中可以看出Fr<Fa,Fc<Fa,分别从地区、日期都对销售量影响不显著。

参考:《统计学(第七版)》贾俊平
https://blog.csdn.net/long636/article/details/104437179

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容