- 连续型变量
血压升高、住院天数、术中出血量 - 临床医学研究
干预性研究、观察性研究、诊断准确性试验
基于前瞻性(回顾性)资料的研究
系统评价与Meta分析
基于开放数据库的研究
由因及果,一般只是确定一个原因。而由果及因,可以推出好几个原因。
横断面研究:(因和果同时暴露)门诊肥胖的女性同时伴有关节炎,到底是肥胖引起的关节炎,还是关节炎引起的肥胖呢?
在医学统计学中要学会三种随机抽样:简单随机化、区组随机化、分层随机化。
简单随机化:R中的sample()
函数
假设检验
第一步:假定二者无区别,制订小概率事件的概率标准,a=0.05(5%)
第二步:计算p值
第三步:根据p值下结论t检验:针对小样本
当n为无限大时,t分布即是正态分布。
- 单样本t检验
目的:检验一个变量的总体均值和某个检测值之间是否存在显著差异
例如:⑴检验某专业毕业生平均收入是否符合该校毕业生的平均收入标准
⑵检验一批产品的平均质量是否符合国家规定的质量标准
案例:已知某试卷全国考生考试平均分数为85分,某学校随机抽取15人参加考试,得平均分数,问,该学校全体学生考试得分能否达到全国平均水平?
自由度df=样本容量-1
score <- c(78,82,83,79,81,77,84,75,86,82,80,78,79,82,81)
sample <- data.frame(score)
View(sample)
#原假设H0:μ=85 备选假设H0:μ!=85
t.test(sample,alternative='two.side',mu=85)
说明不支持原假设,该学校全体学生考试得分并未达到全国平均水平。
- 两独立样本t检验
- 目的:用两个来自不同总体的独立样本,来推断这两个总体的均值是否存在显著差异。
- 例如:⑴比较男女毕业生的平均收入是否存在显著差异
⑵比较男女的平均身高是否存在显著差异 - 案例:某校为测评2教师(教师A,教师B)教学水平,将50名学生随机分为2组,经过一段时间教学后,进行同一份试卷考试,各自得分汇总后,试判断两教师教学水平有无差异?
先建表格:
faculty <- rep(1,25)
score <- c(83,75,78,81,80,80,83,80,79,78,80,76,80,77,72,82,76,87,81,85,65,81,80,93,70)
df1 <- data.frame(faculty,score)
faculty <- rep(2,25)
score <- c(77,91,67,98,94,90,79,90,89,81,71,74,76,91,76,95,97,80,74,99,73,100,75,73,91)
df2 <- data.frame(faculty,score)
newdata <- rbind(df1,df2)
#注意:在按行合并的时候,要保证两个表格的行名一致
t.test(score~faculty,newdata,var.equal=TRUE)
这里的var.equal=TRUE
是假设方差齐性,即两样本方差相等
'大同小异',所以表示两样本均数不同,有差异,教师2的水平优于教师1。
还有一种方式:
t.test(df1$score,df2$score,var.equal=TRUE)
- 配对样本t检验
目的:检验一个对象在某个时间点前后的均值是否存在显著差异
例如:⑴一组病人在治疗前后的健康状况
⑵一群销售人员在接受销售培训前后的业绩情况
案例:一群考生在接受加强复习培训后的成绩与之前是否有差异
先建立数据
score.before <- c(78,81,70,79,77,78,85,82,88,80,80,81,76,81,87,76,79,79,87,80,78,87)
score.after <- c(87,87,81,87,88,80,86,85,85,89,70,81,80,97,95,77,90,90,86,90,79,78)
data <- data.frame(score.before,score.after)
View(data)
t.test(data$score.before,data$score.after,paired=TRUE)
实际上相当于两者相减与0作比较,判断有无差异。结果表示培训后成绩要优秀一些。
相当于:
t.test(data$score.after-data$score.before,mu=0)
review:
Q1:t检验能解决什么样的问题?
⑴检验事物的某一变量是否符合某项标准
⑵检验两个独立的事物之间是否有显著差异
⑶检验一个对象在某个时间点前后是否有显著差异
Q2:t检验使用的前提条件是什么?
总体标准差σ未知,小样本(容量n<30),总体服从正态分布
即:
- 独立
- 正态
- 方差齐性