标签:
教育 |
分类: 教育与心理测量 |
“考试公平”的三种不同含义
谢小庆
摘要:本文讨论了对“考试公平”的不同理解,提出了程序公平、条件公平和事实公平三种不同的“考试公平”概念,讨论了考试公平与效率之间的关系,讨论了考试工作者的责任。
关键词:考试
在谈论“公平”的时候,人们赋予这一概念的含义是不同的。在1999年新版的《教育与心理测验标准》中写到:“不论是就整个社会而言,还是就测量专业的学术界而言,近期都还看不到人们在测验公平问题上取得一致意见的前景……公平性概念可以从多种角度来定义,公平并不完全是一个技术概念,关于公平的定义和解释随不同的社会和政治环境而变化。”(American Educational Research Association,第80页)显然,对于什么是“公平”,还需要做出进一步的分析。
第一考试公平:程序公平
“公平”的第一种用法是指“程序公平”,即对所有参加考试的应考者都一视同仁,使所有考生得到相同的对待。这种用法体现为1968年Cleary提出的关于考试公平性的定义:如果一项考试不会系统地高估或低估某一组人,这个考试就是公平的。(参看Cole & Zieky,第371页)这种用法也体现为1989年Cole 和 Moss将考试偏见定义为“对不同可界定的被试子团体的效度差异”。(Cole & Moss,第205页)我们可以将此称为“第一考试公平”。
为了实现“程序公平”,今天还有许多事情要做。在北京单独命题之前,高考总分550分的北京考生可以上清华、北大,在同样试卷上得到同样分数的山东、湖北考生可能还不能进重点院校。考生受到如此不同的区别对待,显然损害了“程序公平”。
据2002年7月22日《南方日报》一篇题为“高考作文两次改判背后的幸与不幸”的文章披露,在2002年四川省高考语文阅卷工作中,一篇作文因“与传统观点格格不入”,评卷老师只给20分。“将此文提出来与整个阅卷室的数十位评卷教师讨论,结果争议很大,从20多分改成了40多分,最后请示评卷指导委员会,最终被认为是一篇不可多得的佳作,给出了相当高的分数。”(满分60)控制主观题的评分误差,是保证“程序公平”的一个方面。
今天,社会上各种属于标准参照的考试很多,如自学考试,语言水平证书考试,会计师、经济师、律师的资格考试,等等。每次考试的试卷不同,尽管命题者总是希望不同的试卷具有相同的难度,但实际上不同试卷之间的难度差异很难完全避免。水平较低的考生可能因碰巧遇到较容易的试卷而取得资格,水平较高的考生可能因碰巧遇到较难的试卷而得不到资格。这种情况,对考生是不公平的。
以数学方法对不同试卷之间的难度差异进行校正的过程即等值(equating)。“托福”、GRE以及被称为“汉语托福”的中国汉语水平考试(HSK)等考试都经过了等值处理。但是,今天国内的许多资格考试和自学高考尚没有经过等值处理,这种状况也违背了“程序公平”。
研究发现,一些涉及武器、足球的题目存在男女之间的组间差异,有利于男性考生,不利于女性考生。在中国,一些涉及空调、微波炉、地下铁道等现代设施的题目存在城乡考生之间的组间差异,有利于城市考生而不利于农村考生。通过“题目功能差异(differential item functioning, DIF)”分析,可以克服这种由试题DIF导致的不公平。
第二考试公平:条件公平
“公平”的第二种用法是指“条件公平”,即不仅追求所有参加考试的应考者在考试中受到相同的对待,而且要求参加考试的考生在教育条件方面也能受到相同的对待。就这种意义上的“公平”而言,以同样的考试考查学习条件迥异的学生,并不能算公平。同样的一个高考分数,对于一个艰苦环境中的自学者和一个优越环境中接受特殊辅导的学生,具有很不同的意义。我们可以将此称为“第二考试公平”。
今天,不论中外,都在考试中采用了降低少数民族考生的分数线、照顾教育条件落后地区的政策。这些政策,体现了对“第二考试公平”的追求。今天高考中存在的分数线地区差异,有些可能在一定程度上体现了对这种“条件公平”的追求,如青海、新疆等教育条件较差地区的录取分数线较低。有些却不是,如北京等教育条件较好的地区的录取分数线反而较低。
第三考试公平:事实公平
“公平”的第三种用法是指“事实公平”。即不仅追求所有参加考试的应考者在考试中受到相同的对待,不仅追求参加考试的考生在以往教育条件方面也受到相同的对待,而且追求所有具有“天赋人权”的儿童都具有平等分享优质教育资源的权利。优质教育资源有限,通过考试把有限的优质教育资源提供给强者而不是弱者,使强者更强,弱者更弱,自然会扩大社会的不平等,会加速社会的两极分化。我们可以将“事实公平”称为“第三考试公平”。
今天,在小学、初中入学中所采用的“就近入学、电脑派位”方式,就是对这种“事实公平”的追求。
考试公平与效率
通过考试,学校、机关、企业可以选拔到优秀的人才,可以拒绝不称职的庸才。显然,考试可以带来效率。就“靠分儿总比靠钱好,卷子总比条子好,考官总比跑官好”而言,考试也可以抑制权力和金钱的影响,可以带来社会的公正。但是,三种不同的“考试公平”概念,与效率之间具有并不相同的关系。
“第一考试公平”与效率是基本统一的。只有坚持“程序公平”,考试才能发挥“优胜劣汰”的作用,才能成为提高工作效率的一个有效工具。在主要关注考生今天已有水平的标准参照性考试中,“程序公平”与效率具有更高的一致性。在关注考生未来发展潜力的预测性考试中,严格的“程序公平”可能会影响到考试的效度,从而影响到人力资源的使用效率。在招生、招工中,如果简单地坚持“一视同仁”,不考虑不同考生的成长环境和教育条件,未必能够达到最好的人才选拔效果。有时候,为了发现那些真正具有潜力的人才,我们不仅要看他今天已经走到了哪里,还需要看他是从哪里出发,看他走过了什么样的路程,看他已经走过了多远的路程。
“第二考试公平”与效率之间具有很高的统一性,尤其是在预测性考试中。不仅看一个考生今天已经掌握了哪些知识和技能,而且看他是在什么样的条件下、在什么样的老师指导下、通过什么方式达到了今天的水平。这种选拔人才的方式,可能会比单纯看考试分数的方式具有更高的效率。在美国的大学招生中,学校常常会录取490分的学生而拒绝500分的学生,很少听说500分的学生会为此去诉讼校方。
“第三考试公平”的实现通常是以牺牲效率为代价的。通常,将优质教育资源提供给强者而不是弱者,会产生更大的效率。对“事实公平”的追求,势必会影响到社会的经济发展速度。
通过以上分析可以看出,虽然在一定条件下考试具有维护公平的意义,但考试的主要功能并不是维护社会公平,而是提高工作效率。
考试工作者的责任
作为一个考试工作者,首先需要追求“第一考试公平”。今天,不同省份之间高考分数线还存在很大差异,考试中有时还存在较大的主观评分误差,许多考试尚未实现等值,试卷中还时常会有一些存在DIF的题目,等等。因此,实现“第一考试公平”尚任重道远。
考试效度是考试工作者的职业追求目标。为了使考试具有更高的效度,考试工作者也需要对“条件公平”予以适当的关注,需要注意对考试分数做出更合理的解释,促进社会更合理地使用考试分数。
考试工作者也是人,也是知识分子,也是学者。作为一个人、一个知识分子、一个学者,他还需要关注社会上的弱势群体,还需要致力于避免过度的社会两极分化。我个人认为,一个考试工作者也需要考虑到“条件公平”和“事实公平”的问题,他应该支持那些向少数民族、落后地区倾斜的考试政策,他也应该支持那些旨在追求“事实公平”的“就近入学、电脑派位”入学政策。
参考文献:
[1] American Educational Research Association, American Psychological Association, & National Council on Measurement in Education(1999) Standards for educational and psychological testing. Washington, DC: American Psychological Association.
[2] Cole, N. S.& Moss(1989) Bias in test use, in Linn ed. Educational measurement, Macmillan Publishing.201-219
[3] Cole, N. S. & Zieky, M. J. (2001) The new faces of fairness, Journal of Educational Measurement, 38-4,369-382
[4] 谢小庆、王洋(2002):关于考试公平性的一些思考,载《考试研究》(2002-2),天津人民出版社
(发表与《考试研究文集(第3辑)》,经济科学出版社2006年出版)

加载中…