冒泡~:最近在回顾一些以前学过的概率论和数理统计的知识 发现这三个抽样分布经常出现,在参数估计和假设检验也会运用到,所以做一下整理。
【首先,这三个抽样分布都是来自正态总体的常用的分布 可以根据情况应用于显著性检测】
1.χ2分布
定义:
设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X1²+X2²+......+Xn²所服从的分布为自由度为 n 的χ2分布.
自由度:所包含的独立变量的个数 (eg:χ2=X1²+X2² 自由度为2)
图和式子如下:
关于图像:
从分布图可以看出:图像分布在第一象限内,卡方值都是正值,呈右偏态,随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,向正无穷方向延伸(这是因为均值n越来越大),分布曲线也越来越低(因为方差2n越来越大)。
更细致观察:
当n=1或者2时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值的概率,即观察频数有可能接近期望频数。
当n大于2时:卡方分布先低后高再低,其外形沿着正向扭曲
一些结论:
1.χ2分布具有可加性:若χ12~χ2(n),χ22~χ2(m),且二者相互独立,则χ12+χ22~χ2(n+m)
2.卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。
应用:(补充ing)
卡方分布指出观察频数与期望频数之间差异显著性,和其他假设一样,这取决于显著性水平。
1、显性水平α进行检验(常用的显著性水平0.05)
2、检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性。
3、卡方概率表的使用:
卡方分布假设检验步骤: 总是使用右尾
1、确定要进行检验的假设(H0)及其备择假设H1.
2、求出期望E和自由度n.
3、确定用于做决策的拒绝域(右尾).
4、计算检验统计量.
5、查看检验统计量是否在拒绝域内.
6、做出决策.
ps:卡方分布检验其实就是假设检验的特殊形式。
2.t分布
定义:
t分布又叫student-t分布,常常用于根据小样本来估计呈正态分布且方差值为知的样本的均值。
(一个前提是:t分布的样本的总体必须符合正态分布。t分布一般用于小样本(样本量比较小)的情形。)
假设X服从标准正态分布即X~N(0,1),Y服从自由度n的卡方分布即Y~χ2(n),且X与Y是相互独立的,那么Z=X/sqrt(Y/n)的分布成为自由的为n的t分布,记为Z~t(n).
期望 E(T)=0,方差 D(T)=n/(n-2),n>2
图和式子如下:
图像的特点:
1.图像整体以0为中心,左右对称的单峰分布;
2.t分布是一簇曲线,可发现其形态变化与n(即其自由度)大小有关。
自由度n越小,t分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布曲线,当自由度无限大时,t分布就成了正态分布
应用:
t检验
1.建立假设、确定检验水准α
H0:μ = μ0 (零假设null hypothesis)
H1:μ ≠ μ0(备择假设alternative hypothesis)
双侧检验,检验水准:α=0.05
2.计算检验统计量
3.查相应界值表,确定P值,下结论。
(ps:t检验适用于两个变量均数间的差异检验)
3.F分布
期望E(F)=n/(n-2),方差D(F)=2n^2(m+n-2)/m(n-2)^2(n-4)
图像:
F分布为非对称分布 有两个分位点
应用:方差的同质性检验
此检验参考资料:数据统计基础之F分布及其应用 - 振裕 - CSDN博客
方差分析(ANOVA也称为变异数分析和F检验)
详细可参考:https://wenku.baidu.com/view/bcca13af7c1cfad6195fa779.html
finally~
今天也要假装元气满满的鸭!