《伍尔夫福克教育心理学》第十五章读书笔记

第十五章 教学评估与测验

要点:

. 区分评价、测量和评估以及各自的功能

. 区分常模参照评估和标准参照评估

. 了解如何用信度、效度和无偏性来理解和判断评估过程

. 了解当前标准化测验中存在的问题

第一节 教学评估的基本含义

区分测量与评估。

测量是指用数字描述一个事件或特征;评估虽包括测量,但比测量范围更宽广,因为评估包

含各种取样和观察学生知识、技能和能力的方式。

区分形成性评估与终结性评估。

在课堂中,评估可能是形成性的(不评分诊断性),也可能是终结性的(需要评分)。形成性评估有助于制订教学计划,终结性评估可总结学生的学习成就。

区分常模参照测验与标准参照测验。

在常模参照测验中,一个学生的表现需要和其他学生的平均表现进行比较。在标准参照测验中,分数需要与事先制定的标准进行比较。虽然常模参照测验涵盖了大量的一般目标,但其结果并不能告诉你学生是否做好了学习高级知识的准备,这种测验不适合测量情感目标和动作技能目标。标准参照测验可以测量对具体目标的掌握程度

什么是测验信度?

个测验需要考虑的重点之一是,基于测验结果进行决策和判断的效度问题。效度的证据可

以和内容、效标和构念有关。构念效度的范围最广,并包括了内容效度和效标效度。为了让测验有效,测验首先需要达到信度要求,然而信度并不能保证效度。

什么是无偏性?

评估应该具有无偏性。当测验包含的材料对某些群体具有冒犯性或不公平性时,偏见就会出现,这些群体包括不同性别、不同社会经济地位不同种族和不同宗教信仰的学生。文化公平性测验并没有解决评估偏见的问题

第二节 课堂测验评估

测验怎样支持学习?

学习受到一定频率的测验支持,这些测验使用累积性的问题让学生运用和整合相关知识。记住这些测验的目的,教师就可以更好地设计这些测验或者评价课本的配套测验。

描述两种传统的测验。

两种传统的测验形式就是客观题测验和论述题测验。客观题测验包括多选题、判断题、填空题、连线题,教师需要记住这些题目的编写规则。对论述题的编写需要仔细的计划,同时需要拟定评分标准,以避免评分的偏差。

第三节 真实课堂评估

什么是真实性评估?

传统测验的批评者认为,教师应该使用真实性测验以及其他的真实测验程序。真实性测验要求学生完成与真实的校外生活情景相关的任务和问题解决。

描述档案袋和成果展示。

档案袋和成果展示是真实性评估的两种形式。档案袋是对学生作品的收集,有的时候需要选择体现学生成长改进的作品,有的时候需要选择学生的“最佳作品”。成果展示是对学生理解程度的公开表现

档案袋和行为表现评估的信度、效度和公平性如何?

真实性评估并不能保证信度、效度和公平性(无偏性)。使用准则是让评估更可信、更有效的一种方式。可是,基于准则的评估结果并不一定能预测与任务相关的行为表现。同样,评分者可能基于个体的外貌、谈吐进行打分,也可能对少数族群学生的行为表现或资源匮乏的群体抱有偏见,这些偏见会让少数族群学生在形成性评估中处于不利的地位。

教师应该怎样使用非正式评估?

非正式评估是不需要评分的评估方式,主要用来收集多种信息以帮助教师进行决策。非正式评估包括学生观察和核查表、提问、学生自我评估等。在非正式评估中,日记是被非常灵活和广泛使用的方式。学生常常需要按照一定频率完成个人或小组日记。

第四节 评分

描述两种评分的方式。

评分既可以是常模参照,也可以是标准参照。种流行的常模参照评分系统就是根据曲线分布

进行评分,这种方式是把学生的成绩与平均表现水平相比进行等级排序。一般不推荐这种方式。标准参照评分的成绩单,通常描述了每个学生每门功课学习得怎么样。

失败对学习的好处

学生需要面对失败的经验,教师应该高标准要求学生,以鼓励他们努力学习。如果能够提供合适的反馈,那么偶尔的失败是具有积极意义的。从不知道如何面对失败的学生,一旦面临失败他们往往会很快放弃。

“社会升级”和“留级”哪一个更好?

让一个学习有困难的学生简单地留级或升级都不能保证这个学生学习的进步。除非与班里其他学生相比岁数更小或情感上不成熟而不得不留级外,一般而言最好的方法是让学生继续升级,并在暑假为他提供额外的教学支持。差异化教学能够阻止问题的发生。

分数能够促进学习和动机吗?

对错误本身或错误策略的使用进行具体的口头或书面反馈,同时提供给学生如何提高的建议,并对积极的行为表现进行表扬,这些方式都能够增强学习。如果分数与有意义的学习相联系,那么分数也能够激励学生的学习动机。

第五节 标准化测验

什么是平均数、中数、众数和标准差

平均数、中数和众数都是对集中趋势的测量,标准差反映了分数与平均数的离散程度。正态分布是一种钟形曲线的频数分布。

当前测验存在的问题是什么?

关于标准化测验的矛盾主要聚焦于以下几个方面:测验的作用及其解释、过多通过测验来评估学校、对测验分数的不当解释以及对教师的测验。如果测验符合重要的课程目标,接受测验的学生在某个合适的阶段确实学习了这些课程,测验本身没有偏差,学生能够理解测验文字,施测方法正确,那么测验结果就能够提供一些反映学校质量的信息。可是对实际测验的行动研究发现了一些令人担忧的结果,它可能会限制课程内容的扩展或逼迫学生尽早退学。教师应该运用测验的结果去改善教学,而不是对学生形成刻板印象或仅仅证明自己对学生的低期望。

学生能变成更好的应试者吗?怎样做?

如果学生拥有相应的测验经历或者接受过测验技巧和问题解决能力的培训的话,那么学生在标准化测验上的成绩就可能提高。很多学生都能够从有关如何准备和如何参加考试的直接教学中获益。让学生参与设计测验,也能够对学生有所帮助。很多学生在接受了全面的应试准备训练后,尤其是当测验技巧与具体问题、学习内容、测验内容密切相关时,测验成绩提高了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容