加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

心理测量的必备条件

(2009-09-09 20:22:02)
标签:

教育

分类: 心理测量学教学

心理测量(mental measurement)是依据约定的心理学理论,采用某种方法将人的特定行为反应数量化,并据此推论与这些行为相应的心理水平的过程。心理测量的对象可以是智力、性格、兴趣、动机等各种心理特质。智力测验属于心理测量,在讨论智力测验之前必须先介绍心理测量的必备条件。

 

(一)信度

 

信度(reliability)是指一个测验所测得的分数的可靠性或稳定性。一个测验测量某种东西,其结果是一致的,那么这个测量是可靠的。我们之所以相信尺子,是因为它能给出同样的测量,无论是今天用或是明天用,无论是木匠用或是裁缝用。同尺子一样,心理测量技术只有当它反复测量并能给出相同的结果时才是可靠的。当一个测验具有信度时,用它去测量同一群人在不同的时间里所测得的分数几乎是相同的。

 

不同的测验要求不同的测量信度。经常用来估计测验信度的指标有三种。

 

第一种叫折半信度(splithalf reliability)。如果测量某种特征的测验是由许多小题目构成的,那么测验内部的一致性就很重要。在编制这种测验时可用折半法求其信度,即以一份测验施测于一群人,将测验的题目随机地分为两半,分别计算分数,然后用这两组分数求出相关系数。这种相关系数称为折半信度系数。折半信度是估计测验信度的一种常用方法。一份经过精心编制的能力测验,其折半信度系数应该在0.90以上。

 

第二种叫再测信度(testretest reliability),就是用同一种测验在不同的时间里先后施测于同一群被试,以测得的分数求相关,即得到再测信度系数。用再测法估计测验信度,两次施测的时间间隔要适当。两次施测的间隔时间过短,第二次施测成绩往往会受第一次施测的影响,从而造成再测信度的假性高相关。两次施测的间隔时间过长,第二次施测成绩会因受心理发展和练习的影响,而使测验信度降低。由于测验信度受时间和其他因素的影响,因此,任何一个测验都可有不止一个再测信度系数。再测信度对于估计测量某种相对稳定的特质(如智力)是特别有用的。

 

第三种叫评分者信度(scorer reliability)。当测验要求评分者解释一个人的答案时,评分者信度是很重要的。例如创造力测验和测量性格的投射测验,在评分时都容易掺杂有主观判断的成分。因此在评分前,评分者必须经过相当专门的训练,这样评定的分数才不至于波动大大。考察评分者信度的方法是,随机抽取相当份数的试卷,由两位评分者按记分规则分别给分,然后根据每份试卷的两个分数计算其相关系数,即得评分者信度。一般要求在成对的受过训练的评分者之间一致性应该达0.90以上,才认为评分是客观的。

 

(二)效度

 

效度(validity)是指一个测验欲测量某种心理特征的准确程度。一个有效度的测验,测量的结果必然是该测验要测得的东西。任何一种测量工具都有一定的目的和使用范围。尺是用来测量长度的,秤是用来测量重量的。用秤来测量重量是有效的,用它来测量长度便是无效的。同样,智力测验只能用来测量智力,用它来测量性格,那便是无效的。因此,在使用测验时,一定要预先了解测验的功能和它的使用范围。

 

确定一个测验效度的方法,通常是以一群人在该测验上的得分和另一个效度标准求相关,以其相关系数的大小来表示效度。以智力测验为例,通常用下列方法来确定一个智力测验的效度。(1)与标准的智力测验求相关。一般是与斯坦福—比纳量表相比较,求其相关系数。因为斯坦福—比纳量表是被以往的研究所肯定了的。(2)与学生在校的成绩求相关。因为在条件(如年龄、环境等)相同的情况下,聪明者比愚笨者的作业成绩要好。(3)与学生就业后的成绩求相关。如果相关系数高,则该测验的效度就高。效度系数越高(0.80以上),则预测效果越高。这种效度是用来预测将来行为的,因而称为预测效度(predictive validity)。还有一种效度叫构想效度(construct validity),它是根据某种心理学理论构想而建立的。

 

有效度的测验能测量出我们要测的东西,它所测量的东西显然不是随意可变的。因此,有效度的测量也常常具有信度。但是,有信度的测验不一定是有效度的。例如,测量脑袋的大小作为智力的高低,这种测量是很有信度的,因为用一根皮尺以同样的方法每次测量的结果都是相同的。但是脑袋的大小不是智力的有效测量,因为它与学生成就或智力测验上的得分之间没有任何联系。

 

(三)常模

 

个人接受测验所得到的分数还只是原始分数,它本身并没有任何实际意义,只有把它同别人在该测验上得到的分数进行比较,才能判断其优劣高低。为了使原始分数有意义,同时为了使不同的原始分数可以比较,在编制测验时必须建立解释原始分数的参照标准。这种作为参照标准的分数分布就是常模(norm)。

 

常模的建立是一个相当复杂的过程。一般经过下列几个步骤:先是根据测验适用对象的某种特质,如年龄、性别或受教育水平等确定一个总体;然后从具有这些特质的总体中随机抽取一群被试作为样本,实施测验;对样本施测后所得的分数加以统计整理,得出平均值和标准差等统计量,即可作为该总体在该项测验上的常模。

 

测验编制大多会为年龄、性别或受教育程度等不同的总体建立几组常模,以作为不同被试的比较标准。心理测验中常见的常模有以年龄为样本建立的年龄常模(几乎所有的智力测验都建立有一组组的年龄常模)、以年级为样本建立的年级常模、以地区为样本建立的地区性常模和以全国样本建立的全国性常模。

 

除了信度、效度和常模,在编制测验时还必须规定一定的实施程序,包括如何发卷、收卷,如何对被试说明,如何解答问题,如何控制时间,如何记分等,这些都必须在测验手册中明确加以规定

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有