1. 简述相关分析和回归分析的区别和联系。
回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。
广义上说相关分析包括回归分析,但严格地讲,二者有区别。
回归分析是以数学方式表示变量间的关系,而相关分析则是检验或度量这些关系的密切程度,两者相辅相成。
如果通过相关分析显示出变量间的关系非常密切,则通过所求得的回归模型可获得相当准确的推算值,所以经常将相关与回归放在一起论述。
2. 简述正态分布与标准正态分布的区别与联系。
1)正态分布:是连续型随机变量的概率分布。
2)标准正态分布:是正态分布的一种,具有正态分布的所有特征。均值μ=0,方差σ2=1。
3)区别:
对称线不同
最大值:当x=??
分布形态:(正态)随随机变量的平均值,标准差不同而变化。平均值决定曲线位置,标准差决定高地阔狭形状;标准正态:固定的形态
4)联系:所有正态分布都可以通过Z分数公式转换成标准正态分布
3. 简述假设检验中两类错误的定义及其关系。
弃真错误(Ⅰ型错误):虚无假设H0本来是正确的,但拒绝了H0。α错误
取伪错误(Ⅱ类错误。)虚无假设H0本来不正确但却接受了H0。β错误
2) 两类错误的关系
a) α+β不一定等于1
b) 在其他条件不变的情况下,α与β不可能同时减小或增大
c) 统计检验力1-β
4. 简述可以用哪些方法检验一个测验的效度。
测量工具的效度是相对于测量目标而言的。根据测量目标的不同,对测验效度的检验方法有三种:
1) 基于所测内容的效度验证方法
考察测量工具本身的具体内容是不是测量目标特质或行为领域的一个有代表性的样本。
2) 基于效标关联性的效度验证方法
考察被试在该测量工具上的表现与另外一个独立存在的,可观察的相关行为特征表现(效标)之间的关联性程度。即,求测量工具与效标评价结果之前的相关关系。
3) 基于所测心理结构的效度验证方法
验证测量工具测出某种心理特质或特质结构的程度。常用的有专家判断分析法/测验内部一致性分析法/与现有研究结论一致性的分析法等。
5. 简述测验标准化的含义及提高测验标准化程度的方法。
标准化主要是为了控制测量的随机误差和系统误差。教育与心理测量中的标准化可以理解为一系列严格的标准,也可以理解为一个过程,即测验的标准化过程。
测验标准化包括下面四个方面,提高测验标准化程度也可以从下面四个方面着手
1) 测验编制过程标准化
包括编制步骤的标准化和编制质量的标准化。
2) 测验实施标准化
包括施测时对主试及其行为的要求、对被试的要求、对测试场所内外环境的要求、测试过程顺序的要求等
3) 测验评分标准化
是指题目要有公认的科学答案,有统一规范的评分方法和评分标准,特别是主观性题目的评分标准要尽量客观和细化。
4) 测验分数解释标准化
是指测验的报告分数要有明确的解释方法和解释依据。
6. 什么是速度测验和难度测验?两者的区别是什么?
难度测验要求被试解决具有一定难度的问题。
速度测验的题目往往是一般被试甚至是所有被试都能正确解答的题目,但其数量很大,测验中要求每一个被试尽快作答,在规定时间内正确作答越多越好。速度测验主要测量的是思维的敏捷程度。
难度测验与速度测验似乎是一个问题的两极。但在实际上很少有纯粹的难度测验和纯粹的速度测验,更多的是介于两极之间某种状态的测验,有的强调难度,有的强调速度。
7. 解释心理测验分数时应注意哪些问题。
不同测验结果的解释方法不同。
常模参照测验注重报告被试在群体中的相对地位,标准参照测验注重报告被试合格与否或达到了何种水平。
需要注意的是,任何测验都有误差,心理测验的误差有时是十分严重的,造成误差的原因也是很复杂的,所以对于心理测验结果进行解释时,一定要有辩证思维,不要绝对化,不要标签化。(辩证的思维)
特别需要注意对测验结果处于劣势地位的青少年儿童的解释,要善于在个体内部作比较,要更多强调优势特质,鼓励改善劣势特质。要以发展的眼光评价和解释任何一个个体的测验结果,防止心理测验对被试造成负面影响,阻碍个体的发展。(发展的眼光)
8. 简述测量误差的含义和类别。
1) 误差是在测量中与目的无关的变异所引起的不准确或不一致的现象,误差有两种:随机误差和系统误差。
2) 随机误差是由与测量目的无关的偶然因素引起,而又不易控制的误差。这种误差的方向和大小变化完全是随机的,无规律可循。
影响信度、效度。
3) 系统误差是由与测量目的无关的变异引起的一种恒定而有规律的误差。稳定地存在于每一个测量中,此时测值虽然一致但不正确。
只与效度有关。
9. 简述控制测量误差的方法。
想要控制误差就要求测验标准化,即测验的编制过程、施测、评分和测验分数解释都标准化,这样才能够有效控制导致误差的因素,以减少误差,使测验分数更可信、更有效。
1) 提高编制测验的科学性
即编制步骤标准化和编制质量的标准化
2) 施测过程标准化
包括施测时对主试及其行为的要求、对被试的要求、对测试场所内外环境的要求、测试过程的要求等
3) 评分与计分的科学性与标准化
题目要求公认的科学答案,统一的评分方法和评分标准
4) 对测验结果解释的标准化
即测验的报告分数要有明确的解释方法和解释依据。
10. 简述心理测验编制的基本过程。
1) 确定测验目的
将目标具体化
2) 设计测验编制方案、制定测验编制计划
目的明确之后就需要设计一个科学、详细、可行的测验编制方案。双向细目表(内容和技能,各题的比例)
3) 编写题目和指导语
题目是测验的基本元素也是测验的主体材料 。材料要丰富、普遍、趣味。题目类型:主客观题。
编写要求:发挥题型功能,测出预测心理品质
4) 测试分析
分析的目的是评估和筛选题目,确保题目的科学性,有效性,准确性等
5) 组卷
有了足够的高质量题目才能开始组卷,组卷时还要严格按照设计好的各种题量分布选调题目,然后合理安排题目顺序,以达到有效控制测验的系统误差的目的。
6) 信度、效度调查
要对测验的整体质量作信度效度的调查,信度效度证据足够,且达到一定标准。
7) 编制测验分数系统
测验的原始分数是以测验内容为参照背景的一种分数,不方便比较。
如果测验的目的就是获取以测试内容为参照背景的分数,则原始分数就可以作为测验的报告分数;
如测验目的是获取以被试群体为参照背景的分数,那么就必须将原始分数转换成其它某种报告分数的形式。(测验常模的编制)
8) 编写测验使用手册:
正规测验必须备有使用手册,以便指导测验使用者正确使用测验。
9) 编制测验备份
正规测验需要编制测验备份,测验备份应该是正式测验的平行复份。
11. 举例说明称名数据、顺序数据、等距数据和等比数据之间的区别。
据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和等比数据四种类型。
1) 称名数据:nominal data 只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间的差异大小,在教育和心理类调查研究中,有关被试属性的调查资料,大多属于这类数据;
2) 顺序数据:ordinal data 是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如:学生的等级评定/喜爱程度/品质等级/能力等级/兴趣等。此类数据不能进行加减乘除运算。
3) 等距数据:interval data 是有相等单位但无绝对零的数据,如温度/各种能力分数/智商等只能是用加减运算,不能使用乘除运算。
4) 比率数据:ratio data 即表明量的大小,也有相等的单位,同时还具有绝对零点,如身高/体重/反应时/各种感觉阙值的物理量等都属于这种数据类型。
12. 什么是标准分数?它具有哪些优点?
标准分数 Z分数 Z-score 是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
它是一个原始分数与平均数之差除以标准差所得的商数,无实际单位。
公式:
优点:
1) 可比性。
不同性质的成绩,一经转换为标准分数(均值为零,标准差为1),相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性。
2) 可加性。
标准分数是一个不受原始分数单位影响的抽象化数值,能使不性质的原始分数具有相同的参照点(0),因而可以相加。
3) 明确性。
知道了某一被试的标准分数,利用标准正态分布函数值表,可以知道该分数在全体分数中的位置,即百分等级,也就知道了该被试分数在全体被试分数中的地位,所以标准分数比原始分数意义更为明确。
4) 稳定性。
原始分数转换为标准分数后,规定标准差为1,保证了不同性质的分数在总分数中的权重一样,使分数更稳定/更全面/更真实的反应被试的水平。
13. 解释相关系数时应注意什么?
1) 相关系数表明两个变量之间的关系密切程度。不是等距数据,比较相关系数时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更亲密。
2) 相关系数绝对值的大小表明了两列测量数据相互相间的相关程度。绝对值相同的正负相关系数值,表示的相关关系程度一样,方向不同。
3) 当两个变量间的关系受其他变量影响时,两者之间可能出现伪相关,这时两列变量之间的相关系数没有任何实际意义
4) 相关关系不是因果关系,相关值较大的两类事物之间不一定存在因果关系。
14. 什么因素可以决定在假设检验中应用z分数还是t分数。
Z检验:
a) 总体正态分布、方差已知或大样本的平均数显著性和平均数差异显著性检验
b) 非正态分布的皮尔逊积差相关系数和二列相关系数的显著性检验
c) 两个相关系数分别由两组被试得到的相关系数差异性检验
t检验:
a) 总体正态分布、方差未知的平均数显著性检验和平均数差异显著性检验
b) 正态分布的皮尔逊相关系数(r)显著性检验
c) 相关系数由同一组被试取得的相关系数差异显著性检验
15. 何谓样本平均数的分布?
样本分布指样本统计量的分布。
样本平均数的分布指从基本随机变量为正态分布的总体中,采用放回随机抽样方法,每次从这个总体中抽取大小为n的一个样本,计算出平均数ū1,然后把这些样本放回总样本,再抽取大小为n的样本,算出ū2,再放回去...要这样反复计算出无限个ū,这无限个ū的分布就是样本平均数的分布。
16. 何谓点估计与区间估计,它们各有哪些优缺点?
点估计是用样本统计量来估计总体参数,用数轴上的某一点值来对未知总体参数进行估计;
优点:精确度高,可以提供总体参数的估计值
缺点:它以误差的存在为前提,点估计是一个随机变量,估计的准确程度取决于误差的大小。不能提供准确估计的概率。
区间估计是根据估计量以一定可靠程度推断总体参数所在的区间范围,是用数轴上的一段距离表示未知参数可能落入的范围。
区间估计不仅能够给出总体参数的一个估计范围,还可以给出估计精度,并进一步说明估计结果的准确程度。但是,区间估计中对区间的计算和解释有难度。
19. 对两个以上平均数两两之间的差异检验为什么不能两两之间进行t检验?
同时比较的平均数越多,其中差异较大的一对所得t值超过原定临界值tα的概率就越大,这是α错误的概率将明显增加,或者说本来达不到显著性水平的差异就很容易被说成是显著了,这时用t检验就不适宜。当需要对3个以上平均数的差异进行比较时,单纯的使用多次t检验的方法是不可靠的。在这种情况下,需要应用多重比较的方法进行检验。
多重比较法用在方差分析之后,若发现平均数有显著差异时,则再从所处理的实验水准中检视一对或多对平均数间是否有差异存在。
这种工作常须比较好几对平均数的差异,就叫做多重比较
20. 常用的平均数差异显著性检验有哪几种?(至少说三种,指出每种检验的适用条件)。
平均数差异显著性检验就是对两个样本平均数之间差异的检验。常用的有Z检验、t检验和Z’检验。
1) 两总体都是正态分布、两总体方差都已知,用Z检验
2) 两总体都是正态分布、两总体方差都未知,用t检验
3) 两总体非正态分布,样本量n>30或n>50,用Z’检验。
21. 简述点二列相关的适用条件。
有些变量的测量结果只有两种类别(如男、女;成功、失败),这种按事物的某一性质划分的只有两类结果的变量称为二分变量。
如果一个点数列中的点与一个“二分”数列中的点存在一一对应的关系,则称这两个数列为点二列。
点二列相关是考察两列观测值一个为连续变量(点数据),另一个为“二分”称名变量(二分型数据)之间相关程度的统计方法。
多用于评价是非类测验题目的内部一致性等问题。是非类测验题每题的得分只有两种结果,答对得分,答错不得分,每一题的“对”“错”就成为二分称名变量,而整个测验的总分是一列等距或等比性质的连续变量,要计算每一题与总分的相关,就需要用到点二列相关方法。
22. 简述众数的概念,并指明在哪些情况下适合使用众数作为集中量数。
众数mode又称为范数,密集数,通常数等,常用符号Mo表示。众数是指在次数分布中出现次数最多的那个数的数值,是集中量数的一种,但是众数不是一个优良的集中量数,下列情况下则会经常应用众数:
1) 当需要快速而粗略地寻求一组数据的代表值时
2) 当一组数据出现不同质的情况时,可用众数表示典型情况,如工资收入,学生成绩等常以次数最多者为代表值;
3) 当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数;
4) 当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标;
5) 当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。
23. 如果一组数据呈正偏态分布,那么其平均数、中位数与众数的关系如何?(画图说明)
正偏态分布中,M> 中位数Md> Mo
24. 两个平均数差异的显著性检验比一个平均数显著性检验增多了哪些前提条件?
两个平均数差异的显著性检验和一个平均数显著性检验相比,不但要考虑总体分布和总体方差,需要满足的前提条件增加了:
1) 两个总体方差是否已知
2) 两个样本是否相关
3) 两个样本容量是否相同
不同条件条件需用不同公式,不能用错
25. 简述积差相关和斯皮尔曼等级相关的适用条件。
1) 积差相关适用条件:
a) 要求成对的数据,即若干个个体中,每个个体都有两种不同的观测值。任意两个个体之间的观测值不能求相关。如小李的语文和数学成绩。
成对数据的数目不宜少于30对,否则缺乏代表性。
b) 两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。
c) 两个相关的变量是连续变量,也就是两列数据都是测量数据。
d) 两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。
2) 斯皮尔曼等级相关适用条件:
a) 等级性质的变量
b)只有两列变量 ,并具有线性关系
c)主要 用于解决称名数据和顺序数据的相关问题。
d)对于等距或等比性质的连续性变量,可降维度成等级数据,这时不必考虑分数是否正态
优点:适用范围比积差相差大,对数据总体分布不做要求
27. 柱状(条形)图与直方图有何区别?
柱状图与直方图看着相似,事实上有着严格的区别:
1) 描述的数据类型不同。
柱状图用于描述称名型数据或计数数据,而直方图主要用来描述分组的连续性数据
2) 表示数据多少的方式不同。
柱状图用直条的长短或高低表示数据的多少和大小,而直方图用面积表述数据的多少和大小,直方图的总面积与总次数相等
3) 坐标轴上的标尺分点意义不同。
柱状图的坐标轴是分类轴,而直方图的一个坐标轴上表示的是另一个刻度值。
4) 图形直观形状不同。
柱状图之间有间隔,直条与直条之间的间隔大小没有任何关系,不表示任何意义。直方图各个直方块之间紧密相连没有间隙,当在某个数据上面的分布人数极少或没有,会出现断点。
28. 简述卡方检验的类别及其含义
按照卡方检验处理问题的性质,可以分为配合度检验、独立性检验和同质性检验:
1) 配合度检验
检验实际观察次数与某种理论次数之间差异的显著性,或检验某种次数分布的总体是否服从某一给定的理论分布,属于单因素检验。
2) 独立性检验
根据两变量的交叉分类的次数表,检验两个变量是独立的还是有关的,属于双因素检验。
3) 同质性检验
检验两个样本在同一变量上的分类是否有类似的分布模式,即这两个样本的数据是否同质的问题。
29. 统计分组应该注意哪些问题?
1) 分组要以被研究对象的本质特性为基础。
面对大量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的本质有关的特性为依据,才能确保分类或分组的正确。
2) 分类标志要明确,要能包括所有的数据。
对数据进行分组时,所依据的特性称为分组或分类的标志。整理数据时,分组标志要明确并且在整理数据的过程中前后一致。这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。另外,所依据的标志必须能将全部数据包括进去,不能有遗漏,也不能中途改变。
30. 简述什么是投射测验?投射测验有什么特点?
投射测验的基本方法是主试向被试提供一些意义模糊的刺激或情景,让被试在不受任何限制的情况下,自由地对刺激或情景做出反应,然后分析被试的反应,推测其人格特征。
其特点如下:
1) 投射测验的指导语大多比较短,而且问的问题都是一般性的,有助于让被试很快放松下来
2) 投射测验中的刺激物或情景往往是非结构化的,也就是模棱两可的,这种刺激特征下需要被试“建构”刺激物的意义
3) 被试在投射测验中可以尽可能发挥自己的想象力
4) 被试对刺激或情景做出的反应是被试整体人格特征的体现
5) 刺激越是非结构化的或模棱两可的,激起被试防御反应的可能性越小,被试的回答或操作越能揭示其无意识的动机、欲望或情感。
31. 什么是析因设计的方差分析?它有哪些特点?
1) 析因设计,又称因子设计,是指两个或多个自变量的各水平组合都要得到考察的实验设计。多因素完全随机设计是其中重要的设计类型
2) 特点如下:
a) 相对于单因素实验设计而言,他具有实验次数少、实验精度高的优点
b) 实验只要进行n>1次重复,就可以估计出因素间的交互作用效应
c) 统计方法复杂,被试人数多。
32. 说明下列各项因素如何影响置信区间的宽度:P199统计
(1)增加样本量,(2)增加样本的变异性,(3)提高置信度。
置信区间是指在某一置信度时总体参数可能落入的区间。
1)增加样本量:使标准误变小
33. 辨析标准差和标准误的概念。
标准差:是方差的算数平方根,用s或SD表示,是反映一组数据离散趋势的量数;
标准误:标准误差(英文:Standard Error)样本平均数分布的标准差。
标准误差用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标
34. 从 α与β两个错误的关系分析,为什么α与β的和不一定等于1?
α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率(这时前提是“H0为真”);β是在接受H0时犯错误的概率(这时前提是“H0为假”),所以α与β的和不一定等于1。
35.变异系数的公式是什么?它主要有哪些应用?
变异系数又称差异系数、相对标准差等,是一种相对差异量,用CV表示,为样本标准差与样本平均数的百分比,公式为:CV=s/X ̅ x 100%
差异系数在心理与教育研究中,常用于:
1)同一团体不同观测值离散程度的比较
eg某小学一年级学生,已知样本团体身高和体重的平均值和标准差,问体重与身高的离散程度哪个大?
2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
如:已知一年级学生和五年级学生的平均分和标准差,问两个年级的分数哪一离散程度大?
36. 什么是拉丁方实验设计?这种设计适用于什么样的研究问题?
在统计的样本实验中,如果有几个变量影响到一个结果时,将这所有变量的作用放在一起来研究,效果比研究单个或数个变量的作用要好得多,这样就大大减少了需要进行的实验次数。
拉丁方是一个 n x n 的方阵,它的行和列都是不可重复的唯一组合,参见下面的例子:
A B C
C A B
B C A
与随机区组实验比较,拉丁方设计控制了两个非处理因素。进一步缩小了实验误差。优点是实验次数少,效率高。尤其适合动物实验和实验室研究。
37. 优良点估计应满足什么条件?
很多估计值可以估计一个未知参数,如样本众数,中数,平均数去估计总体平均数。一个好的估计量应该具备以下特征:
1) 无偏性(unbiased estimated):
好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0;
2) 有效性:
当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好;
3) 一致性:
当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近真值。一致性是对大样本情况下提出的要求,对小样本,它不做衡量指标。
4) 充分性:指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映的总体的信息。
如:x均能反映所有数据所反映的总体信息。中数、众数只反映部分数据所反映的总体信息。
38. 什么是二项分布?其平均数与标准差的意义有哪些?
二项分布是指试验仅有两种不同性质结果的概率分布。即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,因此二项分布又可以说是两个对立事件的概率分布。如通过v s不通过。
(2)二项分布平均数与标准差的意义
如果二项分布接近正态分布,这时,二项分布的X变量(即成功的次数)具有如下性质:X变量为平均数为np,标准差为根号下npq的正态分布。公式中n为独立试验的次数,p为成功事件的概率,q=1–p。
由于n很大时,二项分布逼近正态分布,其平均数、标准差是根据理论推导而来,故用u和σ而不用x均和S表示。二项分布平均数与标准差的含义是指在二项试验中,成功次数的平均数μ=np,成功次数的离散程度σ=根号下npq
论述题
1. 试以平均数的区间估计为例,说明区间估计的原理。
样本分布原理 样本分布标准误 计算区间长度 解释落入置信区间的可能概率
1)计算样本的平均数和标准差
2)计算标准误SE
3)确定置信水平或显著性水平
4)查表:总体方差已知,Z值表;未知,t值表
5)计算置信区间
6)解释总体平均数的置信区间,估计总体平均数落入该区域的正确可能性为1—a,犯错误的可能概率为a
2. 从假设检验的过程看,统计推断有什么特点?
样本统计量得出的差异 做出一般性结论 判断总体参数之间是否存在差异
思路:事先对总体参数做假设 然后利用样本信息检验假设合理性 判断是非接受原假设
假设检验的过程:
1)提出虚无和备择假设
2)选择适当的检验统计量
3)根据问题的要求,规定显著性水平
4)计算检验统计量的值
5)作出决策
统计推断的特点是:根据局部数据,推断总体情形。采用概率性质的反证法,进行概率性的推理。
3. 试述方差分析的基本原理及步骤(举例说明)。
两个或两个以上样本平均数之间的差异检验。
依据方差的可加性原则,具体利用方差的可分解性,把各组数据的总变异分解为若干个不同来源的变异,再计算各部分的均方,两均方一比为F值。将F值与F临界值比较,判断若干平均数是否相等。
步骤:
1)求平方和
2)计算自由度
3)计算均方(一组数的平方和的平均值,离差平方和与自由度之比)
4)计算F值
5)查F值,进行F检验,并作出判断
6)陈列方差分析表
4. 试述心理与教育统计中常用的概率分布及其特点。
1)正态分布
连续随机变量概率分布的一种
2)二项分布
试验只有两种不同性质结果的概率分布 离散型分布
3)样本分布
样本统计量的分布 Z分布 X2分布
5. 试述怎样选择合适的心理测验进行施测?
1) 符合测验目的 ,测验情绪问题就用与之相关的测验量表
2) 符合被试条件
3) 符合标准化程度:信度效度等
4) 有资质的主试
5) 适当的情景
6. 试述心理测验有哪些用途。
几乎各类心理测验方法在教育领域都得到了应用,比如智力测验能力倾向测验人格测验等,但应用最多的还是教育成就测验。 据估计每个学生每年平均要进行2.5次成就测验。成就测验是当今世界应用最为广泛最为频繁的一种教育测验。 以下是教育成就测验在教育领域的用途:
1)教育信息反馈。
教育成就测验的得分可以起到反馈信息,调节教师的教学活动的作用。在某一教学阶段开始前进行的成就测验,能使教师了解学生为完成本阶段的学习任务在知识和技能上的准备情况,从而为修改教育目标和教学计划提供依据。在教学过程中进行的检查测验,能使教师了解学生对有关知识技能的掌握情况,诊断出学生的学习困难所在,以便及时发现教和学中的问题,从而调整教学内容,改进教学方法。在某一教学阶段终了后的总结测验,能使教师了解教育目标是否达到了解学生综合应用和迁移知识技能的能力,同时为确定新的教育目标提供依据。
2)教学工作评价
教育成就测验不但可以用于评价学生,还可用于评价教师,评价一所学校或一个地区的教学质量。
3)研究工具
教育成就测验对教育理论的研究和发展具有重要作用。好的教育体制、教材和教法要通过教育效果来体现,而教育效果在一定程度上又要通过测验成绩来检验。
4)人才选拔与安置
教育成就测验经常被作为人员选拔的工具,例如各种升学考试。也可以用于确定个体是否达到了从事某项活动所需要的最低熟练水平,还可用于对人员进行分类,把候选者安置到适当的岗位上去。
心理测验还在临床领域经济领域和政治与军事领域中有不同的应用。
7. 举例说明怎样编制心理测验指导语,有哪些注意事项。
对被试的指导语,对主试的指导语。
1) 被试
• 对测验的说明
• 被试应该如何做答的指示(包括如何选择反应、记录反应以及时限等)
• 对于纸笔测验一般印在测验的开始部分,也可以单独印在另外一张纸上
• 简单明确
• 题目形式生疏,可以有些例题
举例: 同学您好!这是一份用于科学研究的调查表(这是什么?),填写这份调查表与您的任何学业成绩和操行评定都毫无关系(消除紧张),选项没有对错之分,希望您能根据自己的实际情况如实回答。我们将对你的回答内容给予严格保密,请您放心,谢谢合作! (保密原则)请您仔细阅读每一个题目,每个题目后边都有五个选项供你选择,
1――完全不符合,表示该句描述完全不符合你的实际情况
2――比较不符合,表示该句描述比较不符合你的实际情况
3――无法确定该句描述是否符合你的情况
4――比较符合
5――完全符合实际情况
请你注意:
(1)每个题目只能选一个选项,在相应的数字上划“勾”即可;(反应要求)
(2)每个题目都要回答,做完后检查一遍,不要有漏掉的题目(共85题);
(3)对于题目中不清楚的地方,请举手提问。
注意事项:
• 简单、清晰
• 保密原则
• 真实回答
• 消除紧张
• 举例说明
• 反应要求
2)主试
举例: 各位老师: 您好!感谢您在百忙之中帮助完成本研究调查,在学生完成问卷时,请您注意以下几点: 1. 在学生回答问卷之前,请您指导学生认真阅读注意事项,确保学生理解如何完成问卷。 2. 在学生回答问卷时,要求学生不必就问题进行思考,只需根据学生的实际情况或直接反应作答。 3. 在学生回答测验问题时,如果学生有任何疑问、或不明白的地方,请您不必解释或回答。让学生根据他自己的理解完成问题。 4. 请您确保每个学生回答完所有的问题,不要有漏答、不答的问题。 5. 要求学生在完成问卷时独立作答,不要东张西望,互相商量参考。 6. 请您帮助检查学生是否填写好了姓名等个人信息。
注意事项:
• 测验中应该做的事情
• 测验中不应该做的事情
• 不可任意发挥和解释
• 总的要求是,无论什么人、在什么时候、什么地点使用同一测验,都必须做同样的事,说同样的话。
• 对主试者的指导语与测验是分开的。
8. 在测验实施时,主试应注意哪些事项?
1) 遵守测验指导:
按照指导语的要求实施测验
2) 保持警觉:
不要讲与测验无关的话,监视施测环境防止作弊
3) 建立和谐友好的关系:
不管是个体测验还是团体测验,主试的行动都对被试的动机和行为有着显著并值得注意的影响,因此主试应与被试建立良好关系,以促进其真诚作答。
4) 对特殊问题有所准备:
如施测过程中有被试突然生病、情绪不稳定或被试群体为儿童、老年人或智力发育迟缓者等。
9. 相关方法在编制测验中有哪些应用?
(1)确定信度。
①通过前后测成绩的相关程度确定重测信度;
②通过两复本测验成绩的相关程度确定复本信度;
③在分半法中,通过测验的两独立部分成绩的相关程度确定内在一致性信度;
④一定数量的试卷由不同评分者分别给分,通过其分数的相关程度确定评分者信度。
(2)确定效度。
①由一组被试在独立取自同样内容范围的两个测验复本上得分之相关来作数量的估计,从而推断内容效度;
②运用相关法分析相容效度、区分效度从而推断构想效度;
③通过求测验分数与效标测量间的相关确定效标效度。
(3)确定区分度。
以项目分数与效标分数(或测验总分)的相关作为项目区分度的指标。相关越高,区分能力越好。
10. 试述哪些测量和统计的原因会导致两个变量之间的相关程度被低估?
11. 正态分布的标准差有何统计意义,在统计检验中为什么会用到标准差?
统计学意义:
1)表示数据的离散程度,大表示分散,小表示集中
例如:一个班分数标准差大,说明成绩层次不齐。此时标准差小好
例如:若一个老师所出的试卷,学生考完后标准差大,说明试卷好,把不同水平区分开来
2)在正态分布情况下,与平均数有一定关系
3)表示不同观测值在团体中的相对位置
4)三个标准差以外,看作异常值。作为取舍依据
标准差是一个良好的差异量数,适合进一步的统计运算,优点如下:
1)计算严密,它根据全部数据求得,测量具有代表性。
2)受抽样变动影响小,不同样本的标准差比较稳定
3)反应灵敏,随任何一个数据变化而变化
4)适合代数运算
12. 在进行平均数差异的显著性检验时要考虑哪些条件,才能正确应用统计检验方法分析问题。
13. 怎样正确看待测验的结果?
14. 什么是内在一致性信度和重测信度?
(1)内在一致性:各个题目内容是否测量了相同心理特质?反映题目内容的抽样一致性程度。包括:分半信度、Kuder-Richardson信度、Alpha系数估计法
不能反映不同时间、不同测验条件带来的误差,所以不是重测信度或复本信度的等价评价方法。
(2)重测信度:
一个测量在两个不同时间对同一组被试施测,所得结果的一致性程度。由重测系数表示。
主要考察一个测验能否在不同时间测出相同结果?反映“时间因素”的影响。
使用条件:
测量的是相对稳定的心理特质
不存在明显的练习效应
间隔时间没有专门训练
15. 试述标准分数的概念及其主要应用。
z分数 平均值为0,标准差为1 以标准差为单位,表示一个原始分数在团体中所处的相对位置。离平均数多远,就是表示在平均数以上或以下几个标准差位置。
标准分数可以比较原始分数,还能进行代数运算,用途如下:
1)比较几个性质不同的观测值,在各自分布中,相对位置的高低。
2)计算不同质的观测值的总和和平均值,以表示在团体中的相对位置。
不同质的原始分数如果不等距,没有一个参照点,就不能进行运算。计算平均数时,要求数据必须同质,否则就没有意义。如果已知这些不同质的观测值的次数分布是正态,就可以转化为Z分数来计算。
3)表示标准测验分数。在标准化的教育和心理测验中,为克服标准分数出现小数或负数,常将其转化为正态标准分数。标准分数经过这样的转换后,可保持原始的分布形态,还具有标准分数的一切优点。
16. 完全随机实验设计的特点及统计分析方法是什么?
实验因素是一个或多个,每个因素有不同的实验水平,被试被随机安排到实验处理组中(随机选取被试,随机分组)的实验设计。
特点:
1)数据正态性:总体是正态或近似正态
2)方差可加:总方差=各个方差之和
3)方差齐性:各实验处理的方差相等
(2)采用的方差分析的统计分析方法。
方差分析步骤:
1)求平方和
2)计算自由度
3)计算均方
4)计算F值
5)查F值,进行F检验,并作出判断
6)陈列方差分析表
17. 什么情况下适合用非参数方法进行平均数差异的显著性检验?
非参数方法对样本分布没有要求,适合两总体非正态分布或总体分布形态未知,也适用于数据为等级数据甚至称名数据。
非参数检验方法有如下特点:
1.它一般不需要严格的前提假设。这是它与参数检验相比的最大优点,几乎每种参数检验都有一些严格假设,如果满足这些假设,仍然用参数方法处理,很有可能得出错误结论。而进行非参数检验,不必过多考虑那些假设条件,非常方便。
2.非参数检验,特别适用于顺序资料。在心理与教育等行为科学领域,很多变量属于顺序水平,目前还达不到等级水平,处理这类资料离不开非参数方法。
3.非参数检验,很适用于小样本,且方法简单。心理学研究领域中进行一些规模较大设计较复杂的实验时,常常在正式实验之前需要做一些实验,这时被试少且要求结果尽快处理,用非参数方法很方便。
18. 区组实验设计的特点及统计分析方法是什么?
(1)区间实验设计的特点
把被试划分为几个区组,在每个区组内划分若干个小区,同一区组随机接受不同的处理,每个区组内的被试尽量同质。对每一个区组,接受全部实验处理。对每个实验,在不同的区组内重复次数相同。
区主设计的基本原理就是把实验单位划分为若干区组。一般来讲,区组是根据实验的要求来划分的,对于那些可能影响因变量的变量,但又不是研究者所关注的变量,都可以作为区组变量来考虑,以控制其对因变量的影响。
随机区组设计的目的在于使区组内的被试差异尽量减小,而对区组之间的差异则根据设计要求设定。每种实验处理出现在每个区组中,这时区组之间的差异并不影响各实验处理平均数之间的差异,区组之间的差异可以从误差项中剔除。如果区组之间没有差异,则随机区组设计无助于分辨实验处理之间的差异,这种情况下,无须采用随机化区组设计。
(2)统计分析方法
单因素方差分析
19. 什么是回归分析,回归分析的主要任务是什么?
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
回归分析是应用极其广泛的数据分析方法之一。
分类:
回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
内容(任务):
(1)确定Y与X间的定量关系表达式,这种表达式称为回归方程;
(2)对求得的回归方程的可信度进行检验;
(3)判断自变量X对因变量Y有无影响;
(4)利用所求得的回归方程进行预测和控制。
20. 简要论述对新一代测量理论的看法。
到目前为止,整个统计测验理论的发展可分为两大阶段:标准测验理论阶段和新一代测量理论阶段。经典的测量理论、概化理论、项目反应理论都属于标准测验理论。随着时间的推移,人们不再满足于在总的能力水平层面上进行的测验实践,而是想深入到作答的认知加工过程,以揭示不同被试的认知加工特点。这种研究视野被称为认知水平的的研究范式。在新一代测量理论框架中,应强调宏观和微观、能力水平和认知水平评估并举。
新一代测量理论特征主要包括:
1) 测量将自觉的以实质心理学为基础,并在此指导下,凸显测验设计,同时全面考察反应过程和结果
2) 传统测量将测量对象视为“统计结构”,而新一代测量试图对这一“统计结构”进行分解,更深入地探测个体内部心理过程及心理特质
3) 传统测量假设不同水平的技能呈连续性的变化,所测的能力在一个连续性的量尺上变化,测验目的是将所测能力在连续性量尺上定位。
而新一代测量中所测的特定特质(如技能、策略等),可能会呈现有或无的离散状态 。
4) 传统测量中技能是单维的或多维的,新一代测量中技能的组成部分可以以任何模式联系起来 。不同的被试在不同的情境下,可用不同的策略,技能的组成部分存在时间或逻辑的相依。
5) 传统测量应用项目一致性的几何模型,新一代测量中则应用项目一致性的离散性特征模型。
21. 请论述对教师自编测验的看法。
教师自编测验是指在平时教学中教师自编的一种非标准化测验,相比较而言,它容易编制而且使用起来灵活方便,是学生和教师间反馈信息的重要途径,好的教师自编测验对于诊断学生的学习、评估教学效果有很大的作用。
其特点如下:
1) 测验形式灵活多变,与测验目的完全一致
2) 测验内容与教材内容高度一致
3) 测验难度切合学生的实际水平
4) 测验编制简易快速
教师自编测验通常用于测量学生的学习状况,而标准化成就测验则用来判断学生与常模相比时所处的水平。
由于教师自编测验的编制程序没有标准化教育成就测验那么规范,其信度效度的时限就是一个非常重要的挑战,可以从以下几个方面着手提高:
1) 深入研究教材,深入调查学生
2) 客观评价自己的命题技术,合理使用各种题型
3) 注意总结命题经验,提高命题技术
4) 尽量控制评分误差,防止简单粗糙
5) 做一些测验质量的分析研究
22. 怎样保证心理测验结果的真实性?
要保证心理测验结果的真实性,也就是要尽量提高测验的效度,可以从下面几个方面着手:
1) 测验组成方面
试题是构成测验的要素,测验的效度取决于试题的性能,提高测验效度需要谨慎选择测验材料,适当安排测验的长度,使试题具有相当的鉴别力而且难易程度适中。
2) 测验实施方面
测验的实施程序是影响效度的重要因素。
3) 被试反应方面
被试的兴趣、动机、情绪、态度和身心健康状况等,都能影响t他在测试情景中的行为反应。被试是否充分合作,也会影响测验结果的可靠性与正确性。
23. 一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。
1) 相关关系是指两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定两类现象之间哪个是因,哪个是果。相关的情况可以有三种:
一种是两列变量变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动,称为正相关。如身高与体重的关系。
第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小但与前一列变量指向相反的变动。例如初打字时练习次数越多,出现错误的量就越少。
第三种相关是零相关,即两列变量之间无关系。比如学习成绩与身高的关系
2) 当一个变量的两个水平的相关很高时,需要考虑这种相关是正相关还是负相关,即考虑其变化发展的方向
3) 当一个自变量的两个水平的相关很高时,不能说明两个水平的均数之间没有差异。因为两组变量的相关系数大小只是表明两组的线性关系强弱。即使两组变量成完全正相关,即相关系数为+1,也不能说明两组变量的平均数没有差异。比如两组变量的对应关系为(1,2),(2,3),(3,4)……。即y=x+1。这时两组变量的相关系数为+1,而两组变量的均数是不同的。因为这是在同一个变量的不同水平,而且缺乏足够的信息分析。如果要知道这两个水平均数之间是否有差异,可以采用t检验等方法获得
24. 回归系数是按什么思路计算出来的?对回归系数和标准化回归系数应该如何解释?
25. 简要介绍一个人格测验,并进行评价。
大五人格量表(NEO人格量表):
应用了因素分析法
用来测量人格的五个因素,分别是:外倾性、宜人性、尽职性、情绪稳定性、开放性。每个因素分为6个层面,由6个分量表组成,每个分量表8个题目,共240个题目
外向性:
它一端是极端外向,另一端是极端内向。外向者爱交际,表现得精力充沛、乐观、友好和自信;内向者的这些表现则不突出,但这并不等于说他们就是自我中心的和缺乏精力的,他们偏向于含蓄、自主与稳健。
友善性、宜人性:
得高分的人乐于助人、可靠、富有同情;而得分低的人多抱敌意,为人多疑。前者注重合作而不是竞争;后者喜欢为了自己的利益和信念而争斗。
谨慎性、尽责性:
指我们如何自律、控制自已。处于维度高端的人做事有计划,有条理,并能持之以恒;居于低端的人马虎大意,容易见异思迁,不可靠。
神经质、情绪稳定性:
得高分者比得低分者更容易因为日常生活的压力而感到心烦意乱。得低分者多表现自我调适良好,不易于出现极端反应。
开放性:
指对经验持开放、探求态度,而不仅仅是一种人际意义上的开放。得分高者不墨守成规、独立思考;得分低者多数比较传统,喜欢熟悉的事物多过喜欢新事物。
人格自陈量表的优点:
1.编织严谨、结构明确
2.记分和解释简单快捷
3.包括很多问题,可从不同角度来了解被试情况。
缺陷:
1)作伪和社会赞许效应
2)反应定势的影响
3)效标效度偏低
4)防卫倾向
评价:实验证明,本问卷显示了很好的效标效度和构想效度。
与所有特质人格理论一样,大五人格也不查明人类的行为机制;它更多地描述人格和预测行为,而不能解释人们为什么会表现出这样的行为。不清楚事物的来由,要预测它的走向是比较难得,即使进行了预测,准确性也偏低。不理解自己为什么是这样的人格,我们也很难在职业中有效地扬长避短。
基于以上的原因,大五人格量表很少用于职业生涯规划管理。
26. 试述成就测验与智力测验的区别。
成就测验:是测验人在接受教育后的成就,测验人对特定领域的知识和技能的掌握程度。
智力测验:是测量人的一般认知能力,是稳定的,没有接受教育的
区别:
1)测量目的
2)测量工具:不同量表
3)测验稳定性
27. 参数检验(如t或ANOVA)与非参数检验(如卡方检验)的主要差异在于它们要求的假定和需要的数据。解释这些差异。
【参数检验】当总体分布已知(如总体为正态分布),根据样本数据对总体分布的统计参数进行推断。
【非参数检验】当总体分布未知,或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
(1)要求的假定:
参数检验:需要满足严格的假设。如t检验,基本假设是样本来自于正态分布的总体,如果是两独立样本的t检验,还要求两个总体方差齐。
在方差分析中,要满足正态性、可加性、各组方差齐等基本假设
非参数检验:一般不需要严格的前提假设。不依赖总体分布的具体形式和检验分布(如位置)是否相同。
(2)需要的数据
参数检验:正态分布
非参数检验:适用于计算信息较弱的资料,特别适用于顺序变量、称名变量。
28. 简要介绍一个智力测验,并进行评价。
智力测验是通过测验的方法来衡量人的智力水平高低的一种科学方法。智力被看做人的各种基本能力的综合,因此智力测验又称为普通能力测验。
举例:瑞文推理测验。 《瑞文推理测验》也叫《瑞文渐进矩阵》,是由英国心理学家瑞文于1938年设计的一套非文字智力测验。该测验的编制依据为斯皮尔曼的智力二因素理论,主要测量智力的一般因素,尤其与人的问题解决、清晰知觉、思维、发现和利用自己所需信息以及有效的适应社会生活的能力有关。
主要包括三个测验:标准型(基本型)、彩色型(适应测量幼儿及智力低下者)和高级型(适用于智力超常者),另外还有联合型,适用于5-75岁幼儿、儿童、成人和老年人。
施测过程比较简单,向每个被试发放一本题册和一张答题纸即可。测试过程中,只需主试用例题做一下示范,被试就能明白测验规则,接着被试自己进行测验。
结果需先计算出原始分数,然后按照常模资料来确定被试的智力等级,一般用百分位常模来表示,一般40分钟完成整个测试。
优点在于
1) 适用范围广,测验对象不受年龄、文化、种族和语言限制;
2) 一般可对团体进行测验,也可进行个别施测。
29. 详述测验误差的来源。
1)测验内部引起的误差
主要来源于题目取样(缺乏代表性、用词不准确,题目过难,时间仓促)
题目的数目(测验长度)会影响评价时信息的充分性,近而影响题目的稳定性。
2)施测过程引起的误差
环境:影响做题心态,造成测验得分不稳定
主试:不能严格按照测验指导手册操作、控制测验过程,会严重影响不同测验场景下被试的的分数。
意外干扰
评分
3)被试本身引起的误差
经验
练习效应:时间间隔
动机
焦虑水平
反应定势
生理因素
30. 详述提高测验信度的方法。
控制随机误差的方法有:
1)增加测验长度。
在保证与原测验内容同质的条件下,适当增加测验的长度是提高测验信度的一个比较有效的方法。注意三点:1)同质题目2)高质量3)数目适当
2)保证题目内容的同质性(内容信度)
3)控制题目的难度分布接近正态,大多数题目难度处于中等水平。
由于信度由相关系数表示,所以如果能使被试得分的分布有宽的全距,相关系数会比较合适,不会导致低估测验的信度。而保持大部分题目难度处于中等水平,能使分布有较宽全距。
4)提高试题区分度
原理同上
5)测验者必须按照规范程序进行测试
使用者严格按照测验指导手册规定施测,才可获得一致的测验结果
6)严格控制评分误差(评分者信度)
评分者在评分时,可能受到自身评分习惯的影响,也会受到对评分标准理解的影响,因此要对评分者进行一定的训练,以保证评分标准和评分结果的一致性。
7)控制测试场所导致的误差
环境可能会影响作答心态,如噪音,气温等。