给女朋友写的生统资料_Part12

我感觉到后面应该会讲的比较省略了,公式模板什么的套的比较多,因为主要是用来做考试复习和速查的。大家如果有什么疑问,可以在下面提出来。在这一部分,我也会注重把解题的步骤写出来(好像写出来是有分的)。其实我们假设检验的步骤就是,建立H0和H1,然后确定分布,然后确定我们的样本值以及更极端值所占有的比率,如果比例太小,说明这个样本值不常见,就可以拒绝H0,接受H1。

样本均值比较

样本均值的比较我们一般会涉及到 Z检验 和 t检验。Z检验针对的是总体方差已知的情况,t检验针对的总体方差未知的情况。一般来说,t检验更为的常见。

使用t检验,前体条件必须是样本均值的抽样分布符合正态分布。如果总体是正态分布,那么小样本的样本均值抽样分布也可以符合正态分布。如果总体不是正态分布,那么只有样本量达到一定大小,才可以符合正态分布。但一般来说,我们的考试生物学数据是符合正态分布的,而且课上也不提检验正态性,所以我这里不说检验正态分布了。后面ANOVA就提到了检验正态性。。。。。

当然,某些生物学也是不符合正态性的,就要考虑用非参数检验了。

Z检验

Z检验就是根据样本值,得到样本值的Z-score,然后计算概率。

单样本均值比较,即与某个数字进行比较的话,就是
z= \frac{\bar{x}-\mu}{\sigma/\sqrt{n}}
两样本的均值比较的话,就是
z=\frac{(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}
举个例子:

假设我们已知总体身高符合正态分布,且标准差已知为5,那么我们的样本数据为……(这里放上一堆数字,总共为20)。那么我们想要检验总体均值是否8。

步骤为:

我们建立原假设和备则假设,并设置显著性\alpha=0.05
H_0:\mu=8\quad H_1:\mu \neq8
然后计算p-value

# 模拟数字
> data <- rnorm(20,mean = 8,sd = 5)
> data
 [1] 10.688820  7.462011  6.457040  6.146526 20.790506  9.610317  3.614535  5.224481
 [9] 16.044720  8.231625  5.929559 13.817802  8.168671  3.331038  7.902722  7.818987
[17] -4.585604  5.304461  3.261386 11.483466

# 计算样本均值和标准差
> mean(data)
[1] 7.835154
> sd(data)
[1] 5.286252

# 计算z-score
> (mean(data)-8)*sqrt(20)/(sd(data))
[1] -0.1394591

# 计算p-value
# 因为z-score < 0,所以计算p-value是
> 2*pnorm(-0.1394591)
[1] 0.8890874

由于p-value > 0.05,所以接受H0。即认为总体均值是等于8的。

首先要注意单尾和双尾的问题,如果H1是不等于,就是双尾。H1是大于或者小于,就是单尾。单尾的话,p-value不用乘以2了。

z-score这里手算的话,要注意z-score的正负,如果是负的话是2*pnorm(z-score)。如果是正的话,就是2*(1-pnorm(z-score))

t检验

单样本的t检验
t=\frac{\bar{x}-\mu}{s/\sqrt{n}}
配对样本的t检验

配对样本的t检验,本质上就是配对样本对应值之差的单样本检验。所以也是一样的公式

独立两样本的t检验——方差相等
t = \frac{(x_1-x_2)-(\mu_1-\mu_2)}{\sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}}

s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}

t分布的自由度为
df=n_1+n_2-2

独立两样本的t检验——方差不相等
t=\frac{(x_1-x_2)-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}
t分布的自由度为:
df = \frac{(s_1^2/n_1+s_2^2/n2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}
t分布的步骤还是跟z差不多的,只要注意写上H0和H1就行了。不过不同的是,需要记得去检验方差齐性。方差齐性的R函数是var.test。方差齐性检验完了,如果是齐性的,就在t.test 里面设置 var.equal=T

举个例子(这里我不写H0,H1了)

# 生成数据
> t_data1 <- rnorm(20)
> t_data2 <- rnorm(20)

# 先确定是不是配对数据,我们先假设是配对的
> t.test(t_data1,t_data2,paired = T)

    Paired t-test

data:  t_data1 and t_data2
t = 0.82025, df = 19, p-value = 0.4222
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.3972871  0.9093616
sample estimates:
mean of the differences 
              0.2560372 

# 也可以假设是不配对的
# 然后确定你的H1假设是单尾还是双尾,然后调整
# 我们假设是双尾,即两者均值不等——双尾其实是默认值
t.test(t_data1,t_data2,alternative = "two.sided")


# 然后要做方差齐性检验(这里也要写H0和H1,即假设方差是否相等)
> var.test(t_data1,t_data2)

    F test to compare two variances

data:  t_data1 and t_data2
F = 1.6712, num df = 19, denom df = 19, p-value = 0.2719
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.6614761 4.2221719
sample estimates:
ratio of variances 
          1.671187 
          
# 做完方差齐性之后,根据结果,设置var.equal参数
> t.test(t_data1,t_data2,var.equal = T)

    Two Sample t-test

data:  t_data1 and t_data2
t = 0.77421, df = 38, p-value = 0.4436
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.4134474  0.9255219
sample estimates:
  mean of x   mean of y 
 0.21364009 -0.04239716 

样本方差比较

单样本方差比较

对于单样本的方差比较,我们用卡方分布。卡方统计量为
\chi^2=\frac{(n-1)s^2}{\sigma^2}
例子就用PPT上这张图

PPT这里的零假设是方差等于35

只不过这里p值的计算可以利用R来做,不用查表

# 还是双端
> 2*pchisq(2.103,9)
[1] 0.02053599

关于不同情况下的双端计算,可以看这张PPT。


12_2.png

两样本方差比较

对于两样本的方差比较,我们用F检验。

F分布的定义为设随机变量 X_1 \sim \chi^2(m)X_2 \sim \chi^2(n),X1与X2独立。则称 F=\frac{X1/m}{X2/n}的分布是自由度为m与n的F分布,记为 F\sim F(m,n)。这个定义恰好适用与我们的两样本比较。

检验过程用PPT表示:

12_3.png
12_4.png

当然,在R里面,你直接用var.test就可以了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容