标签:
考试制度两依据一参考命题机制评价改革ppl |
分类: 读书评论 |
——读郑方贤等《上海高考研究报告》一书有感
上海作为首批高考综合改革的试点省市,从2014年启动方案设计到现在,已经走过7年的探索历程,先行先试的实践成果被各后续启动高考综合改革的省市采纳和借鉴,为全国高考综合改革的全面落地做出了应有的贡献。
从2017年第一次高考综合改革方案落地,到2019年3年一轮的持续实践,社会各界对上海高考综合改革的认识越来越清晰,教育系统内部的深化改革更是如火如荼。作为招考机构,在试题研制、成绩分布、考务组织、招生录取等各环节所呈现的稳定性,也有效地促进了社会大局的稳定、让人民群众有了更好的获得感。从语文、数学、外语三科高考科目的角度回顾、反思、总结三年的改革实践,不仅有利于自身专业水平的提升,也能给正在推进和即将进入高考综合改革的省市提供有益的参考。
一、考试制度的重大变革
教育法规定,国家实行国家教育考试制度。高考作为国家教育考试制度中的一环,对于实现教育机会均等、保护受教育者的合法权益具有十分重要的意义。
2014年颁布的《国务院关于深化考试招生制度改革的实施意见》,吹响了招生考试制度变革的号角。在上述意见的框架下,上海率先实施高考综合改革试点,从制度层面进行了如下多个方面的探索和实践:一是高考科目设置调整为“3+3”;二是高考成绩由统一和选考成绩构成,积极推进综合素质评价在招生录取过程中施行“两依据一参考”的招生录取模式;三是持续开展春季高考的试点,为学生提供多元选择的时空;四是数学科目实行文理合卷,没有文理的划分;五是外语考试一年举行两次,考生可以选择考一次还是考两次,两次成绩中较高的一次成绩作为高考的成绩计入总分;六是全面开考非通用语种科目,除英语之外还为学生提供俄语、日语、德语、法语、西班牙语的考试;七是增设人机对话外语听说测试,深入考察学生的口语和语言交际能力;八是建设外语标准化考试题库,在全国招考系统中首家建设基于项目反应理论的标准化题库,以确保一年两次的英语考试成绩之间的可比性;就是建立了全流程的命题系统控制机制,确保每年的考试成绩都具有相当高的稳定性;十是改变过去一所高校一个分数的传统录取方式,创新实践以院校专业组为单位录取的新模式……
对上海高考综合改革比较关注的人们,一定对这些年来高考成绩的稳定性印象深刻。其中的关键在于确立了以“考试设计-学情调研-入闱命题-评卷控制-考试评价-考试设计”为环节的命题全流程闭环管理。仅考试设计就包括对课程标准的研读、对考试方案的领会、与测评相关的理论的学习、对历年试卷的评估、对专家教师以及学生的访谈、对试卷结构的调整、对试题表现方式的创新等;在学情调研环节,则以全市各高中学校为研究群体,随机抽样形成各学科各层次的样本学校,通过开展必要的试测,建立起对学科教学及师生的整体了解,获得更为准确的定量信息。这一套命题质量控制机制在实践中被证明行之有效,其显著特点是充分运用了统计学中的科学抽样方法,确保每个阶段所获信息的准确性和代表性,以反映整体的考生信息和考试质量信息。
一系列考试制度和考试机制相关的重大变革,不仅重塑了高考招生考试的全流程,也对高中学校的内涵建设、大学的人才培养等产生了深刻的影响。对高中学校而言,传统的以班级为单位的管理机制被打破,选课走班成为常态;把综合素质培养纳入学校教育体系,保障了立德树人根本任务的落地;实现了学生在课程学习、考试类型、高考科目和院校专业组等多层面的自主选择;不分文理的学习,也更有利于学生多样化有全面的发展。对高校而言,院校专业组的设置让大学更加关注自己的特色,能选择到更适合专业发展的学生,有利于人才的培养。多元的升学路径也让学校更加注重自己的专业建设和品牌影响力,促进大学关注自身的内涵发展。
二、评价理念的有效落地
语文、数学和外语三科作为原始成绩计分的高考科目,既是考生关注的重点,也是相关评价理念落地落实的重要载体。三科在高考综合改革背景下的试题命制,通过各种途径细化落实评价理念,做出了许多有益的探索。
语文学科的命题实现了从传统的经验性命题到以心理与教育测量学为指导的命题的转向,具体体现在双向细目表的制作、考试与课程一致性检验、试卷难度结构模型、选择题分数解释要求等各方面。在试题命制过程中,注重落实对中华传统优秀文化的考查。在“积累应用”板块突出名篇名句在当下生活情境中的正确运用,既符合中华优秀传统文化的传承发展的要求,也符合解决生活中实际问题的命题要求;古诗文阅读的选文,既注重材料本身蕴含的优秀传统文化,又注重其寄寓的精神对当代生活的正面作用,体现了继承发展传统文化与弘扬社会主义核心价值观的融合。从三年考试的数据来看,这些与传统文化相关的试题,对考生具有良好的甄别遴选作用。批判性思维也是语文学科考查的重点之一,通过阅读材料的情境化,设置学术情境、生活情境两大类情境,来进行批判性思维的测评。学术情境是指学术研究中遇到的思维情境,如论文、书评、报告、学术演讲等;生活情境是指日常生活中批判性思维的发生情境,如聊天、工作、选择等。相关试题紧扣课程标准情境化的要求,注重对批判性思维的考查,切实落实高考“立德树人,服务选材,引导教学”的核心功能。
数学学科在命题中根据课程目标来研制考试目标,并逐步改进行为目标,使其更具可测性,使得考试赋分可解释,从而为高校选拔新生提供更为科学可靠的依据。不同年份的数学考试卷,在内容领域上的分值分布有所变化,在每年不同的试题、不同的具体试卷结构设计情况下,均实现了整卷难度稳定,考生总分分布稳定。数学高考改革最重要的变化是文理不再分科,试卷所面对的学生群体发生了变化,试卷的目标、难度、结构等都要随之改变。但其最大的优点是统一了测评的标准,所有的考生可以在同一标准下展现各自的数学学科素养和能力,为考生根据高校科目要求、结合自身特长及兴趣,自由选择选考科目提供了保障。三年来的数据分析显示,不分文理之后的数学卷具有良好的区分度,达到了预期的改革目标,实现了考试的功能。
英语学科在命题中面对的最大挑战,是一年两考如何实现不同次考试之间的可比性。所谓可比性,指的是两次考试的同一分数,说明考生在考试所考察的能力上水平基本相当。如果一个考生第二次考试的成绩比第一次提高了,说明他的能力有了提升,而不是因为因为考试本身的一些因素,如试题难度的差异,能力目标的覆盖面等的变化导致的。而实现两次成绩之间的可比性,有两种比较常见的做法,一是在考试之后对考试结果进行处理,这样的处理有很多种办法,比如剔除一部分质量不好的试题,对考试分数的权重进行调整,利用标准差进行分数的转换等,但考后处理的必然结果,是最终向考生报告的成绩不再是试卷的原始分。这是当下的高考制度所不允许的。另一种做法是建立基于项目反应理论的标准化题库。这是国内此前没有过的探索,是一套全新的试卷命制生产工艺。其优点是试题的各项参数,不依赖某次考试的考生样本,而是通过前测收集试题数据,并利用锚题将不同实体连接起来的方法进行实体参数的校准,以实现实体参数的可比性,组卷的时候利用这些参数筛选试题,组成各项指标符合预期的试卷。上海高考英语试题的命制,实现了这一跨越式的发展,创造是性地实现了基于项目反应理论的标准化题库建设,将其融入到依据经典测量理论命题的方式中来。
三个学科在命题中,都非常注重评分量表的开发。按照确定的能力内涵制定评分标准,同时将考生的应答划分成若干等级,每个等级的表现有明确的描述,考生的应答符合什么描述特征就评定为相应的等级,再转换成对应的分数。这样的量表使得评分结果既具有数值大小,又有内涵或意义,考试分数就有了可解释性,考试结果的效度得到明显提高。
三、教育质量的衡量判断
高考虽然是选拔性考试,要充分发挥其筛选、甄别等功能,但考试积累的大量数据还具有反拨教学的独特价值。对考试数据的分析和研究,对学校教育政策的制定、学校课程教学的建设、家长和学生有效选择的实现等,都具有分成重要的意义。
在这本著作中,作者综合运用各类统计分析的方法,全面地呈现考试背后的各种信息,并对考试的数据进行了多元化的解读。比如将高考成绩和中考录取学生的方式进行对比研究,发现在各种政策因素中,推优生和自荐生两项政策对学生办学质量的提升有着明显的增值效应,这两类考生在学校里所占的比例越高,学校在高考中的成绩增值就越多。相对而言,自荐生的比例对于增值的贡献要高于推荐生比例的贡献。比如多角度地开展了考试结果与考试群体的分析,全面呈现考生的学业表现,也用实证性的数据验证了考试结果与高考综合改革方案设计预期的一致性。
学生在不同学科中的表现有一些共性的特点值得我们深思。比如说,语文、英语两科,女生的学业表现优于男生,在高分段考生占比中,女生明显领先;而数学学科的情况正好相反,男生的数学学业成绩优于女生,在高分段考生占比中,男生明显领先。比如说,三门学科中,女生在各年度的标准差都低于男生,说明女生群体内部的差异比较小,男生群体的差异相对要大一些。再比如说,在三科的考试中,高分段考生在所有思维能力目标上的表现都能较为均衡的优于其他层次考生,在综合思维上优势明显,高分段考生在综合能力上发挥最为稳定。
英语的一年两考,不仅在可比性上做出了有益的探索和实践,在学生群体成绩的比较上的整体数据也很值得研究。从整体上看,6月份的考试相比1月份的考试,考试成绩提升的比例在52%~56%之间,考试成绩保持不变的考生的占比大约在4~5%之间,考试成绩下降的考生的占比通常在39%~43%之间。这一方面说明,一年两次的英语试卷确实具有可比性,对学生的能力能做出较为准确的诊断;另一方面也提醒考生,未必都要两次英语考试都参加,可以根据自己的实际学习能力做出抉择。
在上海高考综合改革实施期间,《中国英语能力等级量表》(简称CSE)也正式颁布,这是我国首个面向全体英语学习者的能力标准,旨在用一把尺子衡量学生运用英语的能力,包含9个级别。其中CSE4对应高中毕业需要达到的能力水平,CSE3则对应初中毕业需要达到的能力水平。考试院及时完成了上海高考英语与CSE的对接研究。研究结果表明,上海考生的英语水平并不如预期中那么突出,在听力阅读这两个维度上表现出较高的水平,但在口语及写作这两个维度上则相对较弱,鲜有考生达到CS E5或以上水平,写作这一维度上,更有50%左右的考生仅达到CSE2的水平。在写作这一维度上,徐汇、长宁、杨浦、闵行4个考区达到CSE4的考生占比明显高于其他考区。将近一半的考生能在4个纬度上都达到CSE3,说明他们基本能应对日常生活中的听说读写,但只有不到6%的考生在4个维度上都达到CSE4,也说明他们缺乏运用语言进行更深度交流的能力。本书的作者为此也对高中的英语教学提出了相关的改进建议。
《上海高考研究报告(2017-2019)》 郑方贤等编著,人民教育出版社2021年版