16-假设检验之T检验

样本量较小（n<30），且总体方差未知时，使用T检验。T检验通过比较不同数据的均值，研究两组数据之间是否存在差异。大样本时用Z检验，但当样本量加大时，T分布与正态分布基本没有区别，因此大样本时也可直接使用T检验。

T分布

T检验主要用途：

样本均值与总体均值的差异比较
两样本均值的差异比较

T检验的分类：

单样本t检验
独立样本t检验
配对样本t检验

T检验的分类

R语言中的T检验

t.test(x, y = NULL,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, paired = FALSE, var.equal = FALSE,
       conf.level = 0.95, ...)
# 其中x，y是由数据构成的向量。（如果只提供x，则作单个正态总体的均值检验，如果提供x,y则作两个总体的均值检验)
# alternative表示备择假设，two.sided(缺省)，双边检验(H1:μ ≠ μ0)，less表示单边检验(H1:μ < μ0)，greater表示单边检验(H1:μ > μ0)。
# mu表示原假设μ0。conf.level置信水平，即1-α，通常是0.95。var.equal=TRUE表示两样品方差相同，var.equal=FALSE（缺省）表示两样本方差不同。

1、单样本T检验

例1. 某种原件的寿命X（以小时计）服从正态分布N（μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下：
159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170
问是否有理由认为元件的平均寿命大于255小时？

解：按题意，需检验
H0： μ ≤ 225 H1: μ > 225
此问题属于单边检验问题,可以使用R语言t.test

x <- c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
t.test(x, y=NULL,
      alternative = "greater",
      mu = 225, paired = FALSE, var.equal = FALSE,
      conf.level = 0.95)

> One Sample t-test
> data:  x
> t = 0.66852, df = 15, p-value = 0.257
> alternative hypothesis: true mean is greater than 225
> 95 percent confidence interval:
> 198.2321      Inf
> sample estimates:
> mean of x 
>   241.5

可见P值为0.257 > 0.05 ，不能拒绝原假设。接受H0，即平均寿命不大于225小时。

2、配对样本t检验

例2. 在平炉上进行的一项试验以确定改变操作方法的建议是否会增加钢的得率，试验时在同一个平炉上进行的，每炼一炉钢时除操作方法外，其它条件都尽可能做到相同，先用标准方法炼一炉，然后用新方法炼一炉，以后交替进行，各炼了10炉，其得率分别为
标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3
新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1
设这两个样本相互独立，且分别来自正态总体N（μ1, σ2) 和N（μ2,σ2)，其中μ1，μ2和σ2未知。问新的操作能否提高得率？（取α=0.05）

解1：根据题意，需要假设
H₀：μ₁ ≥ μ₂
H₁：μ₁ < μ₂
因为数据是成对出现的，所以采用配对样本t检验更准确。所谓配对t检验就是Z_i=X_i-Y_i，再对Z进行单样本均值检验。

x <- c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3)
y <- c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1)
t.test(x - y, alternative = "less")

#或者：
t.test(x, y, paired = T)

> One Sample t-test
> data:  x - y
> t = -4.2018, df = 9, p-value = 0.00115
> alternative hypothesis: true mean is less than 0
> 95 percent confidence interval:
>     -Inf -1.803943
> sample estimates:
> mean of x 
>     -3.2

可见P值 < 0.05，拒绝原假设，接受备择假设，即新的操作能够提高得率。

3、独立样本T检验

独立样本t检验需要检验其适用条件，主要是指方差齐性，其他条件：样本独立性一般数据可以保障。t检验对样本正态性具有一定耐受性。
方差齐性可以用car包leveneTest函数检验：

leveneTest(y= , group = )

其中，y是两组样本组成的数据，group是两组样本的分组情况。方差齐性检验之后，才可进行独立样本t检验。

t.test(A, B, var.equal=TRUE，paired=FALSE)
# A、B为数据集，var.equal=TRUE为方差齐性。paired=FALSE非配对样本。

例3：有两组学生(每组10人)，一组采用传统教育，一组采用素质教育。一学期后，两组学生语文成绩(满分100)如下。问两组学生成绩之间差别是否显著。
传统组A
85,84,95,73,77,65,85,93,90,91
素质组B
87,96,77,80,79,96,93,82,84,86

解：方差齐性检验：

x <- c(85,84,95,73,77,65,85,93,90,91)
y <- c(87,96,77,80,79,96,93,82,84,86)

#合并数据
z <- c(x, y)

#数据分组标签
group = as.factor(c(rep(1, 10),rep(2, 10)))
#载入car包
library(car)

#方差齐性检验
leveneTest(y = z, group = group)

#或者使用F检验（又称为方差齐性检验）来测试方差的齐性，使用函数var.test（）
var.test(x,y)

> leveneTest(y = z, group = group)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  1  0.3703 0.5505
      18

结果显示，P=0.5505＞0.05。说明方差齐性。
独立样本t检验：

t.test(x, y, var.equal = T, paired = FALSE)

Two Sample t-test

data:  x and y
t = -0.589, df = 18, p-value = 0.5632
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -10.047193   5.647193
sample estimates:
mean of x mean of y 
     83.8      86.0

结果显示P=0.5632>0.05，不拒绝原假设，说明两者没有区别。

例4：有人测定了甲乙两地区某种饲料的含铁量（mg/kg），结果如下：
甲地：5.9, 3.8, 6.5, 18.3, 18.2, 16.1, 7.6
乙地：6.5, 1.5, 4.1, 5.5, 4.5, 6.1, 4.7
试问这种饲料含铁量在两地间是否有显著差异？

解：先进行方差齐性检验

x <- c(5.9, 3.8, 6.5, 18.3, 18.2, 16.1, 7.6)
y <- c(6.5, 1.5, 4.1, 5.5, 4.5, 6.1, 4.7)
z <- c(x, y)
group <- as.factor(c(rep(1, 7), rep(2, 7)))
df <- data.frame(z, group)

#leveneTest方差齐性检验
library(car)
leveneTest(z, group)

Levene's Test for Homogeneity of Variance (center = median)
      Df F value  Pr(>F)  
group  1  5.0947 0.04343 *
      12                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

因为Pr=0.04343<0.05，拒绝原假设，即方差不齐。此时设定var.equal=FALSE，表示方差不齐，默认是TRUE，方差齐性。可采用t’检验、变量变换或秩和检验等方法。

t.test(x, y, paired=FALSE, var.equal=FALSE)

Welch Two Sample t-test

data:  x and y
t = 2.5111, df = 6.8176, p-value = 0.04121
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  0.3304959 12.0980755
sample estimates:
mean of x mean of y 
 10.91429   4.70000

因为p-value = 0.04121<0.05，拒绝原假设，即这种饲料含铁量在两地间有显著差异。

4、T检验的局限

T检验使用起来很方便，但经常误用的情况包括：
（1）不考虑数据的正态性，只要是两组比较就直接使用t检验（如果不符合正态性，就要采用Wilcoxon检验）；
解决方法：对总体正态检验，或者样本数量>=30
（2）将t检验用于多组实验设计中的两两比较，增加假阳性错误（此时应该使用ANOVA）；
解决方法：使用F检验
（3）不考虑资料是否独立，采用独立资料进行t检验分析。
解决方法：检验样本之间的相关性，保证样本的独立性

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,921评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,635评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,393评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,836评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,833评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,685评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,043评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,694评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,671评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,670评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,779评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,424评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,027评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,984评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,214评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,108评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,517评论 2赞 343

16-假设检验之T检验

1、单样本T检验

2、配对样本t检验

3、独立样本T检验

4、T检验的局限

推荐阅读更多精彩内容