Biostatistics(2)导论

1.4 混杂因素 Confounding Factor

如图所示，X与Y之间没有关系。但是当我们未探测到Z因子的存在时，我们可能会认为X与Y之间存在关系，而此时Z就被称为混杂因素。

ConfoundingFactor.png

举例而言，我们发现每个月冰淇淋的销量与每个月溺死的人数高度相关，但是显然我们知道这两者之间并无关系，它们均由第三个变量——时间所调控。在夏天，天气炎热，吃冰淇淋和游泳的人数量增加；在冬天，天气寒冷，吃冰淇淋和游泳的人数量锐减。

那么要如何控制混杂因素呢？
（1）Control：研究人员先确定潜在的混杂因素再进一步设计研究，排除这些混杂因素的干扰
Blinding盲选-安慰剂效应
单盲实验：不告诉患者他们服用的是药还是安慰剂
双盲实验：不告诉医生和患者他们所使用的是药还是安慰剂
Blocking分块（分组）：当因素无法控制，例如性别效应
研究人员可以比较每个块（组）内的效果/比较块（组）间的效果，以消除这种干扰。
（2）Randomization：为了能够控制我们未能鉴别考虑到的混杂因素，研究者通常会使用随机分配的方法进行实验以削弱这些混杂因素的干扰。
（3）Replication：数据越多，结果则越精确。另外，如果其他人能够重复研究的结果，则结论的准确性就更强。因此，在有限的时间和金钱条件下，研究者会尽可能地重复实验、扩大样本。

1.5 抽样方法 Sampling methods

1、Convenience sampling 简单抽样
你可以获取数据的最直接、简单的方法，但往往这样获得数据质量较差。比如你想要了解人们对待‘death penalty’的态度，随意问路人。

Convenience sampling.png

2、Random sampling 随机抽样
任何一个集合中的成员都有相等的被选中的概率。

iRandom sampling.png

3、Simple Random Sample 简单的随机抽样
为总体中的每个个体分配一个数字，然后使用一个随机方法从选择n个数字，n为样本数量。

4、Stratified Sample 分层抽样
从一个可以分成不同子总体（或称为层）的总体中，按规定的比例从不同层中随机抽取个体。

Stratified Sample.png

5、Cluster Sample 整体抽样
我们把一个总体分成不同的子总体，但是子总体的大小并不均一。每一个个体属于且仅属于其中的某一个子总体。此时，我们随机抽取子总体中n个，将这n个子总体的全部个体作为样本。

Cluster Sample.png

6、Systematic Sample 系统抽样
先将总体的全部单元按照一定顺序排列，然后选择每个k（k为整数）的倍数的个体。如选择第3、6、9....个个体

1.6 处理数据时出现的偏差

当我们想要研究关于总体的某些特征时，我们常常会先进行抽样，根据样本的统计量进行推断。但是由于抽样偏倚等，估计可能是不准确的，从而导致推断是错误的。因此，要求我们要批判性地思考和分析数据和统计结果。

1.6.1 抽样偏倚

1、Voluntary Response Samples 自愿反馈样本
这种情况下，通常不是研究者选取样本，而是人们主动选择成为了样本。
比如，互联网上进行的一些投票，往往只有关注这项投票事项的人才会参与到投票中，而不关心的人不会加入，因此最终的投票结果存在一定的偏倚。
2、Small Samples 小样本
当样本过小时，往往参数的估计精确度较低。
举一个极端的例子：通过民意调查了解人们希望看到哪个总统当选，然而参与调查的义工仅有2人，那么这个结果显然是不太准确的。
3、Loaded Questions 诱导性问题
当你的调查中的问题问法并不客观，而存在一定的引导性，那么最终的结果也会存在一定的偏差。
比如：Do you support a woman’s right to choose an abortion VS Do you support aborting a fetus which would otherwise grow into a healthy human being? 这两种问法显然是有所差异的。
**4、Non Response 没有回复 **
在调查中，我们常常会遇到当某个个体被选为样本时，他并没有给予有效、完整的答复，并没有收集到关于他的信息，从而也会造成最终的结果存在一定的偏差。
5、Missing Data 丢失数据
可能是由于没有答复，也可能是由于实验设计（比如某些问题人们不愿意回答）或者是一些偶然因素导致数据丢失

1.6.2 误导/错误的结果 Misleading and/or erroneous results

这类是一种特殊的偏差，由于某种目的或者其他因素，造成最后的结果产生一定的误导甚至本身就是一个错误的结果。

1、误导性图表 Misleading graphs
房地产商为了说明房价大幅上涨可能会调整坐标轴的单位距离，产生房价飞涨的错觉。

Misleadinggraphs.png

2、百分数 Percentage
百分比经常被人们滥用。
比如：A clothing store advertised that clothes that were currently on sale for 25% off would now be discounted by an additional 50% off. Sounds like a total of 75% off.
However, the 50% off doesn’t include the 25% already discounted before, making the final discount be only a little over 60% off.

3、相关性与因果性 Correlation vs. causality
两个变量相关并不意味着它们存在着因果关系。
比如，之前所提到的每月冰淇凌的销量和溺死的人数。

4、不完整的信息 Partial pictures
比如一家电视公司告诉你，‘我们所有的电视机过去50年都在正常使用’，你显然会认为这家公司制造的电视质量很好，但是如果实际上，这家公司仅仅生产制造了6个月的电视机，你会怎么想呢？

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,793评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,567评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,342评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,825评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,814评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,680评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,033评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,687评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,175评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,668评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,775评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,419评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,020评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,206评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,092评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,510评论 2赞 343