1.假设检验的基本问题
1989年新生儿平均体重 3190g,1990年新生儿随机抽取100个平均体重3210g
1990年新生儿与1989年新生儿的平均体重是否存在显著差异?
假设:1989年新生儿平均体重μ0 与 1990年新生儿平均体重μ 没有显著差异
公式化假设:μ – μ0 = 0
利用1990年新生儿体重的样本信息检验假设是否成立
原假设:H0 : μ = 3190g 原假设:null hypothesis / 零假设
μ是要检验的参数,即1990年新生儿总体体重的均值
原假设也可以写成:
H0 : μ = μ0 / μ – μ0 = 0
原假设不是既定的事实,仅仅是假设,若原假设不成立,则需要在另一个假设中做出选择,这个假设与原假设互补,称为备择假设(alternative hypothesis)/ 替换假设
备择假设: H1 : μ ≠ 3190g
上面的原假设和备择假设的含义分别是:
原假设 → 这两年的新生儿平均体重没有显著的差异
备择假设 → 这两年的新生儿平均体重存在显著的差异
假设检验围绕对原假设是否成立而展开
两类错误
最终利用数据分析得到的结果我们会判断原假设是否成立,这时候可能会犯两类错误
α错误:原假设为真,我们判断原假设为假,即在假设检验中拒绝了本是正确的原假设(弃真)
β错误:原假设为假,我们判断原假设为真,即在假设检验中没有拒绝本是错误的原假设(取伪)
针对上例,具体如下
α错误 → 原假设:H0 : μ = 3190g 正确,但我们认为 H0 : μ ≠ 3190g
β错误 → 原假设:H0 : μ = 3190g 错误,但我们认为 H0 : μ = 3190g
α错误概率暂用α表示,β错误概率暂用β表示,则:
H0为真,我们没有拒绝H0,决策正确,概率 = 1 – α
H0为伪,我们拒绝H0,决策正确,概率 = 1 – β
在样本量一定的情况下,α错误和β错误互斥,一般都首先控制犯α错误,因为原假设一般都比较明确,而备择假设常常模糊。其实H0为伪的时候H1一定为真,就可以把H1当成原假设,这时候若原本犯了β错误,这次就变成了α错误,但是这个备择假设变成的原假设描述非常模糊(μ ≠ 3190g),究竟是 μ > 3190g还是 μ< 3190g不清楚,大的多少也不清楚,所以一般比较关注原本的α错误:H0为真,我们却拒绝它的错误可能性是多大。