统计

抽样采集数据:概率抽样和非概率抽样
概率抽样也称为随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选进样本。它有如下特点:

  • 抽样是按照一定概率以随机原则抽取样本
  • 每个单位被抽中的概率是已知的,或是可以计算出的
  • 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率
    概率抽样和等概率抽样是两个概念,概率抽样,单位之间被抽中的概率可以相等可以不等

非概率抽样

数据误差

数据误差分两类:抽样误差和非抽样误差
抽样误差是由抽样的随机性引起的样本结果于总体真值之间的误差。在概率抽样中,我们依据随机原则抽取样本,可能抽中由这样一些单位组成的样本,也可能抽中又另外一些单位组成的样本。不同的样本可以得到不同的观测结果。
例如,检测一批产品的非优质品率,随机抽出一个样本,样本由若干个产品组成,通过检测得到的非优质品率为30%。如果我们再抽取一个产品数量相同的样本,检测结果很可能不是30%。不同的样本得到不同的结果。但是我们知道总体的真实值只能有一个。我们虽然不知道真值是多少,但是我们如果不断的增加样本量,不同的答案会先总体真值逼近,经过多次抽样,得到多个不同样本的检测结果,就会发现这些结果的分布是有规律的。例如如果总体的真正的非优质品率是30%,那么大部分的样本结果会落在27.2%~32.8%之间。在总体的真值30%为中心,与95%的样本结果在正负2.8%的误差范围内波动。这个正负2.8%是由抽样的随机性带来的,我们把这个误差称为抽样误差。
抽样误差的大小与多方面因素有关,最明显的是样本量的大小,样本量越大,抽样误差就与越小

相对位置的度量

测度每个数据在该组数据中的相对位置,并可以用它判断一组数据是否有离群数据

  • 标准分数 -- 变量值与其平均数的离差除以标准差后的值称为标准分数,也称为标准化值或z分数

  • 经验法则
    当一组数据对称分布时,经验法则表明

    • 约有68%的数据在平均数正负一倍标准差的范围内
    • 约有95%的数据在平均数正负两倍标准差的范围内
    • 约有99%的数据在平均数正负三倍标准差的范围内
      在正负三倍标准差之外的数据在统计上称为离群点。
  • 切比雪夫不等式
    经验法则适用于对称分布的数据。如果一组数据不是对称分布,经验法则就不再适用,这时可以用切比雪夫不等式,它对任何形状的数据都适用。根据切比雪夫不等式,至少有(1-1/k^2)的数据落在正负k个标准差之内。其中k是大于1个任意值,不一定是整数。

    • 至少有75%的数据在平均数正负两倍标准差的范围之内。
    • 至少有89%的数据在平均数正负三倍标准差的范围之内。
    • 至少有94%的数据在平均数正负两四倍标准差的范围之内。

相对离散程度

对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接进行比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
离散系数也称为变异系数,它是一组数据的标准差与其对应的平均数之比。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容