档案袋评价,又称文件夹评价(portfolio assessment)、学生成长记录袋评价、档案评价等,兴起于20世纪80年代的美国,是为了取代传统的标准化考试(standardize test )评价方法,以体现学生学习实际水平的评价方法,被认为是一种“真正的评价。档案袋评价是“真实性评价”的一种。
所谓“真实性评价”是一种矫正标准测验的弊端而使用的质性评价,测量“可信赖”的、“可迁移”的、“可持续”的“21世纪型学力”的评价。
为了形成“核心素养”,就得变革评价方式——从“测定评价观”转型为“问题解决观”。近期,以儿童的“表现”为焦点,综合地捕捉学力形成的真实性评价受到关注。
美国从上世纪70-80年代起倡导严格的教育问责,借助标准测验来测定学生基础知识与基本技能。作为这种潮流的反向,从80年代起,美国教育界开始探讨谓之“真实性评价”的方式。儿童的学力在离开学习现场仅实施一次的纸笔测验,只能是表层的诊断。根据作品,如作文之类的实际业绩来捕捉学习者“原原本本”的学力的真实性评价开始受到关注。标准测验的弊端大体可以列述如下:其一,标准测验仅仅是捕捉答案预先决定的问题,不能综合地测定包括思考力、创造性、表现力之类的学力。其二,标准测验只求碎片化知识的记忆与再现,远离了现代学习观,不能通过有意义、有目的的上下文,学会既知事物与未知事物的关联。其三,标准测验越是处在教育问责的背景下,教学越是容易向测验倾斜。而如果项目与实验学习、协同学习、体验性的问题解决活动被削弱,就矮化了课程。其四,标准测验测量中,作为学习结果的有限评价却被用来预测别的课题与其他状况的成绩,只能沦为诊断精度低的工具,难以捕捉为什么会有这样的成绩。这样,借助标准测验诊断学力的问题就凸显了出来。作为一种替代,依据儿童的作业实绩来捕捉学力的真实性评价应运而生。
所谓“真实性评价”完全不同于单纯测量“知识量”的标准测验,它是一种矫正标准测验的弊端而使用的质性评价,测量“可信赖”的、“可迁移”的、“可持续”的“21世纪型学力”的评价。维金斯(G.P,Wiggins)说,这是评价的一种理想状态。当直接探讨学生面对有价值的课题表现时,评价才是真实的。这种表现性课题是同解决预先决定了标准答案的问题的标准测验迥然不同的。表现性课题是属于最复杂的能够体现儿童学习的实际成绩的内容。大体可以分为笔记与实绩。前者诸如,研究笔记、实验报告、叙事等,后者诸如,朗读,小组讨论、演戏、体育比赛等。成人在直面现实世界中的实际问题,必然会产生高品质的作品和表现。“表现”唯有在具体的行为情境中,同现实社会密切关联之际,才可能体现出真实性。比如,通过给父母写一封信或者面向读者写一篇文章,来替代拼写与作文,可以做出更真实的评价。或者,不是去考有关科学实验的知识点,而是以科学实验本身作为评价的对象。试举牛津大学的两个面试题目:1. 为什么人的鼻子有两个孔,而嘴巴只有一个孔?2. 在英国每4人中有1个死于癌症,但在菲律宾却是每10人中1个,差别的原因是什么?——在这里,教授要求的,不是标准答案,而是判断学生如何思考的,又是如何表达的,是否有创造性与好奇心等。
在“真实性评价”中,最普遍的是“档案袋评价”。所谓“档案袋评价”是指为了促进儿童的学力形成,收集能够进入档案袋的资料与信息。所以“档案袋”意味着每一个儿童的学习过程及其成果的信息与资料,长期地、有目的地积累起来的积聚物。它不是儿童作品的单纯的文件夹,而是可以作为儿童学习足迹的资料,具有某种目的、按照时间序列,有计划地来收集的。这种“档案袋评价”不是考察集体内相对位置的“集体依据评价”,而是捕捉达成目标的现实状况的“目标依据评价”。亦即是根据现实社会的各个领域的实际,设定达成目标,来判断儿童学习的实现状况。
在“档案袋评价”中,提高表现度是重要的。达成目标一般是公开的,参与儿童的学力形成的关系者们应为儿童提供相应的帮助与支援。这样,“档案袋评价”的一大特征是,运用依据目标的评价,明确达成目标,能够让儿童高质量地、独立地达成,以培育自己的学习力与自我评价力。在“档案袋评价”的制作中通过有意识、有计划地积累学习的过程与结果中产出的多种多样的评价学习与资料,达到根据多角度的学习来把握儿童真实学力的整体面貌。