一、等级录取制的隐忧
一年一度的高考、中考相继过去,成绩、等级、志愿填报、录取学校再一次成为学生和家长们口中热门的话题。成绩一出,几家欢喜几家愁,当然除了喜和愁,还有怒和忧。在家长帮论坛里再一次看到每年这个时候总会被提起的话题——录取制,犹如一个常年流着血的伤疤,每每刚一结痂,就被再次揭起,反复刺激着这个民族教育的隐痛。
该帖表示,他从未如此痛恨过等级录取制。现行的中考录取制度是按照一定比例将学生各科成绩分为A、B、C、D、E五个等级,语文、数学、英语、文综(政治+历史)、理综(物理+化学)、提前科(生物+地理+体育)共六科6个维度,最优等级为6A,其次为5A1B、4A2B、3A3B、2A4B、1A5B……依此类推。中考等级评价与录取制度的优点在于倡导均衡发展,以求全面优势,然而摆在面前的现实问题是高考却是另外一套评价与录取制度——总分制。总分制强调综合优势,可以取长补短。这就存在一个非常现实的矛盾和悖论,中考以等级评价录取制度为标准的6A生却不一定是总分制综合评价下的最优生,以2016年中考分数线举例:
考生一各科成绩分别为:语文125A、数学105A、英语114A、文科综合175A、理科综合184A。综合评价:6A(总分703)
考生二各科成绩分别为:语文122B、数学115A、英语115A、文科综合175A、理科综合190A。综合评价:5A1B(总分717)
按照现行等级评价录取制。考生一6A能上最好的学校,被长郡、雅礼、一中、附中四大名校录取。而考生二5A1B只能上次一等的学校,如麓山南雅明德,甚至因为B的科目为语文主科,只能上这类学校的平行班,或者再次一等级学校的重点班。如此下来录取高中的结果差别会相当之大。而若按照总分制来评价和录取。考生一总分703分,考生二717分。考生二会被最好的学校录取,而考生一只能上其次的学校。
成绩为6A的考生一与成绩为5A1B的考生二,在高中接受到文理分科教育和即将到来和施行的3+x模式的高考制度后,5A1B的学生未必不如6A的学生,甚至中考成绩为5A1B的学生考取高分的潜力和可能性更大。
不同的评价和录取标准来衡量,结果可能天差地别,而无论是哪一种标准的选取对考生的人生影响都是非常重大的。所以,标准之争从很大程度上来讲是公平之争和人生之争。而现实的问题是,两种评价标准都有其优势和劣势,而为何到今天,教师或者学校的评价体系能够复杂到令人咂舌的地步,学生的中高考成绩评价体系还是如此单一、非此即彼的粗放做法。
从理论上来看,中考等级制存在的问题似乎比总分制更为严重。它重点强调各科均衡,忽视单科优势下的综合结果(长沙似乎认识到了这一点,于15年开始增加了单科的千分之一的等级提升优势,但似乎并没有收到太好的效果)。客观上讲,它对资质平平,成绩中上,没有特别偏科的学生优势极大。理论上,各科成绩都只要保持在人群中前40%水平即可,从而均衡才是王道。而那些各科皆优的全优生,在这种评价下自然不能凸显出优势来,因为哪怕六科都是顶尖成绩,最后综合评价也是6A,而此6A与均衡达标的彼6A并没有什么不同。而那些某个科目稍有偏科而优势科目十分明显的考生更讨不到什么好处,且相当不利,考生一和考生二的例子就是典型的证明。如若在总分制下,各科皆优的学生会一马当先,优势明显;各科均衡发展的也能取得不错的综合成绩;某科稍有偏科而优势科目十分明显的考生也能通过取长补短取得可观的综合成绩。
从历史和现状上来讲,中考等级制的评价体系也倍受争议。诸多城市和地区,在经历了总分制到等级制评价录取的选择之后,出现了诸多效行和反复的现象。广州在施行了一段时间的等级制后,07年取消了等级制,改为等级加原始分的综合评价录取制。更为彻底“背叛”等级制的是湖北省,13年彻底摒弃等级制,全省各地中考全部统一为总分制。
从中考和高考评价制度的延续性上讲,等级制在其中显得格格不入,甚至有些“脱节”。毕竟,通过中考进入高中的学生是要通过高中的学习来参加高考,进入大学的。而我国现行的高考评价与录取制仍然是总分制。用等级制来招录总分上并不绝对占优势到6A生最终来参加以总分制为评价标准的高考,这是一个相当奇怪和畸形的现象。
在时代和社会发展的今天,评价体系在摸索和试行过程中是越来越科学和全面的,单一的片面多评价体系,有其优势的同时,劣势也会显得更加明显。而人是复杂的动物,任何数字的量化都不能完全客观公正地来评价人。但我们能做的是尽量和无限趋近于公平、客观、科学、全面。综合等级制和分数制,以及其他数据,或许能探究出一条比单一的等级制和总分制更为科学的道路。
我们不要怕麻烦而堕于或惧于改变现行规则,永远没有最好的规则,不与时俱进的规则是最坏的规则。而如今看来,长沙中考等级制的评价和录取体制的改革是迫在眉睫,势在必行。
二、多值评价的曙光
中考结束,成绩公布,不少学生与家长感慨,甚至懊悔、委屈。平时成绩一直非常好,从未出过差错,却在中考那一次砸了。有的说是因为情绪紧张;有的是因为兴奋过度;有的是因为刚好那一天生病感冒,状态不佳。而这些“偶然”影响了正常状态,导致分数“失常”,而这个“失常”的分数却成为了决定终生的标准。这种现象到底委不委屈,冤不冤枉呢?在“一考定终生”的一次性评价的中高考制度下,谁来为他们的委屈辩白,谁来替他们遭遇申冤呢?还是他们自己活该,必须为这些主观的或客观的因素和风险埋单。
在讨论这个问题前,我们先来看三种数值:
偶然值(偶值):一个学生从发展的角度看,状态有好有坏,但都是围绕着基本能力呈现出来的上下动态分布。比如,考生一,语文成绩一般在120分上下,连续五次考试的成绩分别是124分,119分,127分,120分,118分。那么每次成绩都是基本能力的一种偶然体现,与每次考试的时间、地点、心情、身体状态等密切相关。我们把每一次成绩的值称为偶值。“一考定终生”就是偶值评价。在规定时间,规定不同地点(考场),无论考生心理状态,也不管考生此时身体状况,统一考试。理论上,每一个考生的成绩都是该考生能力体现的一个偶值。比如两个能力差不多的学生参加同一次考试,恰巧身心状态皆好的考生发挥除了良好的状态,拿到了一个较高的分数(偶值127分),而刚好感冒的学生没有发挥好,拿到了一个较低的分数(偶值118分)。如果中考正好以此次偶值来评价,发挥良好的考生拿了127分便占了便宜,感冒的学生拿到118分则吃了大亏,然而从多次平均成绩上来看他俩的能力其实不分上下。也正因为这种现象的客观存在,“一考定终生”的考试制度才备受质疑,并在近几年有所松动和改观的趋势,“一考变多考”将在不久的未来成为可能。多考平摊了一考存在的偶然风险,多次呈现更能趋近于真实常态能力,较之一考更为科学。
平均值(均值):在一个考生的多次成绩中或者多科成绩中,平均分数的计量方法,我们已经非常熟悉了。比如考生一连续五次考试的成绩分别是124分,119分,127分,120分,118分,那么他的语文五次平均分为121.6分。我们可以初步判断该考生的语文成绩在均值121.6分左右。均值产生在多次偶值的基础之上,理论上讲偶值越多,均值就越趋于稳定和精准。均值对评价一个考生的平均水平和常态能力有极大的优势。虽然考试评价与录取制度还未采用均值的计量方法,但是均值在教师对学生能力的评价领域以及试卷分析领域已经广泛的运用。
极限值(极值):每一个考生的多次成绩,最高分与最低分都会形成一个阈限。如考生连续五次考试成绩分别是124分,119分,127分,120分,118分,其中最高分为127分,最低分为118分,118分至127分即是该考生的五次语文成绩阈限,说明该考生的成绩是在118至127这9分之间波动的。我们可以根据这个阈限去推断该考生下一次考试成绩大概会出现在这个区间。至于极值则存在两个,一个极小值118,一个极大值127。极小值体现该生能力底线,即最差状态下的能力;极大值则体现该生能力潜力值,展现他可以达到的高度,即最好状态下的能力。当然,并不是几次偶值中就必然会出现极大值和极小值的,只是有限次数的偶值中相对的。现今教育评价体系中,尤其重视对学生潜力的认同和挖掘,往往会用极值来评价学生的能力值,来认同和赞赏他的潜力即是能力。2018年即将施行的英语一考变多考,且取最优值计入总分的方式即是采取的极值评价。这相比偶值评价和均值评价更进了一步,它充分肯定了学生的潜力,并且承认潜力即是能力的体现,有助于激发学生对潜力的发掘。
将来的中高考评价体系要逐渐地采用这三种数值的综合分析与评价,引入多元的数值维度,更加科学、全面的评价学生。最直接的,我们的教育考试评价体系要逐渐“变一考为多考”,“变单值评价为多值评价”。2018年即将施行的高考制度让我们看到了一丝曙光。英语变一考为多考,取最高分计入总成绩,变偶值评价为极值评价。3+x(任选两门优势科目),即是综合了偶值评价与优势科目的极值评价。这些变动都更为科学,更加振奋人心,当然在科学和全面这条道路上目前我们所迈出的步子还远远不够。我也相信不久的将来均值评价也会逐渐进入中高考评价系统。只要评价系统越来越科学、公平、全面,相信学生和家长的委屈、埋怨、懊悔也会越来越少。
2016年7月6日