《行为科学统计》笔记

第一章统计学入门

统计指整理，总结并解释信息的一系列数学过程。（从混乱中找出秩序；能够被科学团体认识及理解的标准化技术）

科学研究通常开始于一个特殊群体的普遍问题。在统计学中，研究者希望研究的整个组被称作总体。（通常很大；被研究的总体应该总是非常明确的）

样本是从一个总体中选择出来的个体的集合，通常在研究中被期望代表总体。

研究开始于关于总体的一个普遍问题。为了回答这个问题，研究者研究了一个样本，然后把结果从样本推广至整个总体。

在描述数据时，我们必须区分数据是来自于总体还是样本。一方面，描述总体的特性——如总体平均数——被称为参数；另一方面，描述样本的特性被称为统计量。

通常，每个总体参数都与一个样本统计量相对应，本书的一大重点就是讲解这种总体参数与样本统计量的对应关系。

描述性统计是把原始数据组织并总结成更易处理的形式的技术。（表或图；平均数等）

推论统计是允许我们研究样本，然后将研究结果推广至样本来自的总体的技术。

通常，研究者使用样本统计量作为推论总体参数的基础。然而，使用样本产生的问题是样本只提供了关于总体的有限信息。虽然样本通常可以代表他们来自的总体，但我们不期望一个样本能够给出关于整个总体的完美精确的描述。通常，在样本统计量和相应的总体参数间存在一些差异。这种差异被称为取样误差。

取样误差的基本理念是：样本统计量根据样本的不同而变化，并且通常与其相应的总体参数不同。

推论性统计的目的是区分描述性统计中的统计量的差异（平均数等）是由偶然因素（取样误差）造成的，还是实验控制造成的。

科学倾向于发现宇宙间的秩序。并且他们能够观察并记录这种规律性的变化。能够变化并且具有不同值的事物被称为变量。

变量可以是因个体而变化的特性（高度，重量，性别等），也可以是可变化的环境条件（温度，时间等）。

不会变化或改变的值被称为常量。

常量是一个特性或条件，他不会变化，并且对每一个个体都是相同的。
在一项研究中，通常用保持常量来控制变量。

一些研究只是简单描述了个体变量的自然状态（调查），然而，很多研究需要检验变量之间的关系。为了建立关系，研究者必须做出观察——也就是说，对于两个变量的测量。这些得到的测量被归入两种数据结构中，来帮助区别不同的研究方法以及不同的统计方法。

测量每个个体的两个变量：相关法
比较两组或多组测量：实验法或非实验法
混淆变量——被试变量、环境变量
控制方法：随机分派、匹配、将变量控制为常量（只用10岁儿童）
注意，在实验中，事实上只测量了一个变量。你应该认识到这与相关法进行的研究是不同的。在相关研究中，两个变量都被测量了，数据由每个个体的两个不同分数组成。
通常，实验将被试没有接受任何处理的条件下得到的被试分数与接受了处理的那些被试分数比较。这类研究的目的是通过证明处理条件的分数与非处理条件的分数之间的不同来说明存在处理相应。（实验条件、控制条件）

非实验或准实验——根据被试变量（性别等）划分组、接受治疗前与接受治疗后比较（无法操纵时间）

很多被行为科学家研究的变量，事实上只是用于帮助描述并解释行为的假设概念。（构念）因为它们不能被直接测量，因此它们是假设的。
虽然像智力这样的构念是一种内部特性，不能被直接观察。但是，我们可以观察或测量一些代表这些构念的行为。外表行为可以被用于得出构念的操作定义。操作定义用可以被观察并测量的行为定义了构念。
操作定义是一个测量过程（一系列操作），它测量了外部行为，并使用测量结果作为定义和对假设的构念的测量。注意，操作定义有两个部分：首先，它描述了一系列测量构念的操作；其次，它用测量结果定义了构念。

离散变量有不同的，不可分割的类别组成。在两个相邻的类别之间不存在其他的值。
离散变量通常限于整数，也可能由性质上不同的观察组成。

对于连续变量，在任意两个观察到的值之间都存在着无限多个可能的值，一个连续变量可以被分割为无限个小数部分。
连续变量的其它两个因素：
1.当测量连续变量时，两个不同的个体很少会得到完全一样的测量。
2.当测量连续变量时，每个测量类别事实上都是一个区间，需要用边界来定义。
实限 X = 70kg 上实限 69.5 下实限 70.5

收集数据要求我们测量观察，测量包括了将事件分类（定性测量）或使用数字描述事物的大小（定量测量）。

四种不同的测量量表：
称名量表：称名量表的测量允许我们确定两个个体是否不同，但是不能分辨这种不同的方向和大小。
虽然称名量表的类别不是量化值，但它们有时候可以用数字代表。
顺序量表：由一组按顺序排列的类别组成，顺序量表的测量将观察的对象按大小排序。
你可以用顺序量表的测量确定两个个体是否相同，并确定这种差异的方向。然而，在顺序量表中你无法确定两个个体间的差异大小。另外，顺序量表经常被用于测量难以被赋予数字值的变量。例如，人们可以列出喜欢的食物，但是可能不能够解释他们喜欢巧克力冰淇淋多于牛排多少。
等距量表由排序的类别组成，这些类别都是完全相同的大小区间，在等距量表中，量表上数字之间的差异等价于量上的差异。然而，大小的比例没有意义。（摄氏度）
等比量表是一种等距量表，并且有一个绝对零值。使用等比量表，数字的比例可以反应量上的比例。（高度，重量）

等距量表具有随意零点。也就是说，零值可以是量表上任意方便使用的位置。特别是，零值并不代表被测量的变量不存在。（0摄氏度）
等比量表的零点不是任意决定的，而是一个有意义的值，代表了没有测量的变量（完全不存在）。绝对的、非任意的零点的存在意味着我们可以测量变量的绝对值。也就是说，测量到零点的距离。这使得我们可以比较测量的数据间的比值。

量表的类型非常重要，因为它们决定了使用或不能使用哪种统计。

N 总体数量 n 样本数量

数据不同的分布方式，对其中心的定义存在着不同的看法。为了处理这些问题，统计学家发展出了3种测量集中趋势的不同方法：平均数、中数以及众数。

为了确定对于一个特定分布哪种测量是最好的，你应该记住，集中趋势的一般性目的是找出单一的最具有代表性的数值。这三种测量中的每一个都用于一个特定情况。

总体的平均数用μ表示，一个样本的平均数由M或x̄。

在任何分布中，一些个体将会靠近平均数，而一些则相对离平均数较远。标准差提供了对到平均数距离典型的或称标准的测量。

除了描述整个分布外，标准差也解释了单个数据。例如，我们知道一个智商为110的人是处于平均数以上，但并不是特例；因为标准距离为σ = 15，高出平均分数10分不能算是极端值。

平均数与标准差是用来描述一组数据的最常用的值。当看到这两个描述统计的时候，你应该能够想象出整组数据。

回归

最后编辑于：2018.01.27 23:35:37

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,386评论 6赞 479
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,939评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,851评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,953评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,971评论 5赞 369
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,784评论 1赞 283
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,126评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,765评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,148评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,744评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,858评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,479评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,080评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,053评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,278评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,245评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,590评论 2赞 343

《行为科学统计》笔记

第一章 统计学入门

相关

回归

推荐阅读更多精彩内容

第一章统计学入门