加载中…
个人资料
谢氏小庆
谢氏小庆
  • 博客等级:
  • 博客积分:0
  • 博客访问:546,310
  • 关注人气:517
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

HSK和MHK的等值(上)

(2008-01-16 15:13:08)
标签:

教育

分类: 教育与心理测量

HSK和MHK的等值(上)

谢小庆

 

 

摘  

 

HSK是为测试母语为非汉语者(包括外国人和华侨)的汉语水平而设立的国家级标准化考试。MHK是专门测试母语非汉语中国少数民族汉语学习者汉语水平的国家级标准化考试。HSK和MHK都是证书考试。如果证书授予标准缺乏稳定性和公平性,如果对使用这一份试卷的人一个标准,对使用另一份试卷的人又一个标准,那么,不仅会大大影响HSK的信度和效度,而且会对有关的决策产生误导,会使考生受到不公平的对待。在HSK和MHK的开发和实施过程中,一直坚持了对考试分数的统计等值处理。在HSK和MHK的等值设计方面,我们综合采用了共同组等值、共同题等值和分半组合的混合设计。在HSK和MHK的等值数据处理方面,我们综合采用了线性等值、等百分位等值和IRT等值。本文介绍了HSK和MHK的等值方法。讨论了各种方法的得失,讨论了今后继续改进的可能性。

 

关键词:等值,HSK,MHK

 

中国汉语水平考试(简称HSK,为汉语拼音缩写)是为测试母语为非汉语者(包括外国人和华侨)的汉语水平而设立的国家级标准化考试。截止到2003年底,已在国内的31个城市设立了56个考点,在亚、欧、美洲和大洋州的33个国家设立了84个考点。已有来自120多个国家的70多万人次参加了HSK考试。中国少数民族汉语水平等级考试(简称MHK,为汉语拼音缩写)是专门测试母语非汉语中国少数民族汉语学习者汉语水平的国家级标准化考试。MHK包括一、二、三、四共四个等级,分别适用于小学毕业、初中毕业、高中毕业和大学毕业的少数民族学生。2002年12月24日教育布发出《关于在有关省区试行中国少数民族汉语水平等级考试的通知》(教民函[2002]7号),决定从2003年起在新疆、内蒙、西藏、吉林等9省区试行MHK考试。2004年,MHK(三级)已经成为新疆、吉林、青海等省区的高考科目。

HSK和MHK都是证书考试。如果证书授予标准缺乏稳定性和公平性,如果对使用这一份试卷的人一个标准,对使用另一份试卷的人又一个标准,那么,不仅会大大影响HSK的信度和效度,而且会对有关的决策产生误导,会使考生受到不公平的对待。

在HSK和MHK的开发和实施过程中,一直坚持了对考试分数的统计等值处理。迄今为止,等值都是在试卷之间实现的,都是在试卷的原始分之间实现的,所有试卷的原始分都被等值到“标准卷”。如果新试卷偏容易,就会适当减分。例如,答对新试卷听力考试的40题,可能仅仅相当于答对“标准卷”的38题。如果新试卷偏难,就会适当加分。例如,答对新试卷听力考试的40题,可能会相当于答对“标准卷”的42题。

在HSK和MHK的等值过程中,我们采用了多种等值设计,采用了多种等值数据的处理方法。

 

一、等值设计

 

在HSK和MHK的等值过程中,我们综合采用了共同组等值、共同题等值和分半组合的混合设计。

 

㈠共同组等值

 

最简单、最直接的等值方法就是将两个不同的测验版本施测于同一组考生,根据这组考生在测验上的表现来建立两个版本之间的等值关系。在共同组等值中,为了保证考生的动机水平,我们在报名时就明确宣布:考生可以自愿参加两次考试,其中一次免费。我们将只报告两次成绩中较好的一次。

有时两次考试安排在同一天的上午和下午。每一组500人。在一次大规模考试中,我们可以安排3组共1500人参加上、下午的两次考试,一次就可以完成3份新试卷的等值数据收集。安排上、下午考试,疲劳效应可能造成等值误差。为了避免疲劳效应。我们有时将两次考试安排在相隔一周的两个星期天。这时,我们假设一周的时间中考生的汉语水平基本不会发生变化。图1给出了一次大规模考试中同日进行共同组等值的示意图。图2给出了隔周进行共同组等值的示意图。HSK和MHK的等值(上)

共同组等值的误差较小,数据处理方便,但组织成本较高。为1500人提供一次免费考试,每人免收考试费250元人民币,我们将损失37.5万元的考试收入。

 

㈡共同题等值

 

由于共同组等值的组织成本太高,我们仅仅偶尔采用。更多情况下,我们采用共同题等值设计。“托福”、GRE、SAT等著名考试均采用了共同题等值设计。在进行共同题等值时,新试卷中将包含一组与标准试卷相同的共同题。例如,一份HSK(初中等)新试卷有170题,其中,包含27道共同题。图3给出了共同题等值设计的示意图。

共同题等值的基本逻辑是:当不同的测验版本被施测于不同的考生样本时,平均分会存在差异。这时,我们不知道造成差异的原因是试卷难度方面的差别,还是考生水平方面的差别。如果两个版本之间存在共同题,我们就可以通过考生在共同题上的表现来估计两组考生的水平,排除了考生水平上的差距,平均分之间的差距就是试卷难度之间的差距。

HSK和MHK的等值(上)

 

共同题等值的问题是“共同题”的暴光率太高。在共同题等值设计中,“共同题”的作用是估计两组不同考生的水平。如果共同题暴光率太高,就不能准确地估计出考生水平,造成等值误差。2003年初,HSK的共同题已经大量出现在HSK辅导书之中。从2003年开始,我们在HSK(初中等)考试中基本不再采用共同题等值设计。

 

㈢分半组合的混合设计

 

共同组等值组织成本过高,共同题等值中“共同题”的暴光率过高。为了避免这两种等值设计的局限,我们开始采用分半组合的混合等值设计。具体做法是:将“标准卷”以分测验为单位,分成SA和SB两部分。同时,将新卷也以分测验为单位分成NA和NB两部分。之后,组成两个用于等值的试卷A 和试卷B。对于新试卷来说,这是一个经过处理的共同组等值。对于参加等值测试的考生来说,这是一个共同题等值,可以在经过等值处理后,即刻报告成绩。

这两个试卷可以在正式考试中应用。在同一次大规模考试中,两个“分半组合”的等值试卷可以同完全不包含标准卷题目的新卷同时施测。考试之后,可以立即通过两个等值卷计算出新卷与标准卷之间的等值关系,并及时报告成绩。为了简化评分程序,我们在新卷原始总分与导出等值总分之间建立了回归方程,用于评分。图4给出了分半组合等值的示意图。HSK和MHK的等值(上)

二、 等值数据处理

 

在等值数据处理方面,我们采用了基于经典测验理论和基于IRT之上的多种等值模型。

 

㈠共同组线性等值模型

 

线性等值公式是:HSK和MHK的等值(上)

HSK和MHK的等值(上)

HSK和MHK的等值(上)HSK和MHK的等值(上)HSK和MHK的等值(上)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有