第二章 心理学的研究方法
(一)验证的背景:客观性的保证
1.为降低观察者偏见observer bias,研究者依赖于标准化standardization和操作性定义operational definition。
标准化意味着在数据的收集阶段使用统一的、一致的程序。操作性定义是以测量它或决定理论存在的特定的操作或程序来界定一个概念,在一个实验内使含义标准化。
实验法experimental methods,它们操作一个自变量来观察其在因变量上产生的效果。
混淆变量confounding variable,当一些被研究的行为效果真正原因被混淆时,实验者对数据的解释就会冒风险。两种常见的混淆: 期望效应expectancy effects:研究者向被试者暗示他所预期发现的行为,并因此引导出期望的反应;
安慰剂效应placebo effect,没有任何一种实验操作,参加实验的被试者也改变了他们的行为。这可能是由于行为反应受到个人对做什么和如何感受的预期的影响,而不受特定的介入程序的影响;
2.应对措施有:
双盲控制double-blind control:通过实验助手和被试都不知道哪一名被试进行了哪项处理来消除偏见;
安慰剂控制placebo control:引入一个不进行任何处理的实验条件;
代表性样本representative sample,代表性样本在诸如男女性别、种族等方面的分布都与总体的特征非常匹配;
被试间设计between-subjects designs,被试被随机分配到实验条件(接受一个或多个实验处理)和控制条件(不接受实验处理)下,来接受不同的程序;
被试内设计within-subjects design,用每一个被试在实验处理前后的行为作为他自己的参照,如A-B-C设计;
缺陷:大多数自然行为模式的丰富性和复杂性可能在控制的实验中成了简单的少数变量的处理;被试者往往知道他们在参加实验;一些重要问题的研究受到伦理约束;
为了解决这些缺陷,心理学家们提出了一些办法:
相关法:通过相关系数(-1~1)。但是高相关只是表明两组数据以一种系统的方式建立了联系,并不意味着一个事件可以导致另一个事件的发生,即相关并不意味着因果关系。
(二)心理测量
1.两种评估测量精确性方法:
信度reliability,指重复测验下得到的数据具有一定的一致性; 效度validity,指测验得到的信息精确地测量了研究者想要测量的变量;
2.伦理道德问题包括获得赞同、研究风险和收益的评估、故意欺骗以及必要的任务报告。
(三)统计
1.描述统计descriptive statistics是在客观的、同一的方法基础上使用数学程序描述数字数据的不同方面:典型分数指标,比如平均数。包括:
频次分布frequency distribution:分布情况;
集中趋势的度量measure of central tendency:众数mode,中数median,平均数mean,得出具有代表性的分数;
离散性的度量measure of variability:全距range,标准差standard deviation;
相关系数correlation coefficient可以告诉我们两个变量之间相关程度和性质。如果在某个变量上获得高分数的人在另一个变量上也获得高分,相关系数将为正值,且相关系数越高,可以根据一个变量的信息越好地预测另一个变量。
2.推论统计inferential statistics利用概率论做出可靠的推论:什么样的结果可能仅仅是由于随机变异而产生的。
由描述统计我们得到了一些数据,我们如何得知这些数据就是有意义的呢?如果采用其他样本,结果会变化吗?样本的结果与总体的差距?
3.正态曲线normal curve:正态曲线的众数、中数、平均数都是同一个数。由平均值和标准值可以推断数据落在某个范围之内的概率。
当由随机因素导致的概率不足5%时(这是人为拟定的,意义类似于高出三个标准差的概率),心理学家将接受这个差异为“真”。显著差异significant difference是指符合这一标准的差异。当出现统计意义上的显著差异时,研究者可以对所考察的行为做出一个结论。(使用概率论里的假设检验)