心理测量的必备条件_站在心理学边沿

http://blog.sina.com.cn/u/1248094992

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

心理测量的必备条件

(2009-09-09 20:22:02)

标签：

教育

分类：心理测量学教学

心理测量（mental measurement）是依据约定的心理学理论，采用某种方法将人的特定行为反应数量化，并据此推论与这些行为相应的心理水平的过程。心理测量的对象可以是智力、性格、兴趣、动机等各种心理特质。智力测验属于心理测量，在讨论智力测验之前必须先介绍心理测量的必备条件。

（一）信度

信度（reliability）是指一个测验所测得的分数的可靠性或稳定性。一个测验测量某种东西，其结果是一致的，那么这个测量是可靠的。我们之所以相信尺子，是因为它能给出同样的测量，无论是今天用或是明天用，无论是木匠用或是裁缝用。同尺子一样，心理测量技术只有当它反复测量并能给出相同的结果时才是可靠的。当一个测验具有信度时，用它去测量同一群人在不同的时间里所测得的分数几乎是相同的。

不同的测验要求不同的测量信度。经常用来估计测验信度的指标有三种。

第一种叫折半信度（splithalf reliability）。如果测量某种特征的测验是由许多小题目构成的，那么测验内部的一致性就很重要。在编制这种测验时可用折半法求其信度，即以一份测验施测于一群人，将测验的题目随机地分为两半，分别计算分数，然后用这两组分数求出相关系数。这种相关系数称为折半信度系数。折半信度是估计测验信度的一种常用方法。一份经过精心编制的能力测验，其折半信度系数应该在0.90以上。

第二种叫再测信度（test－retest reliability），就是用同一种测验在不同的时间里先后施测于同一群被试，以测得的分数求相关，即得到再测信度系数。用再测法估计测验信度，两次施测的时间间隔要适当。两次施测的间隔时间过短，第二次施测成绩往往会受第一次施测的影响，从而造成再测信度的假性高相关。两次施测的间隔时间过长，第二次施测成绩会因受心理发展和练习的影响，而使测验信度降低。由于测验信度受时间和其他因素的影响，因此，任何一个测验都可有不止一个再测信度系数。再测信度对于估计测量某种相对稳定的特质（如智力）是特别有用的。

第三种叫评分者信度（scorer reliability）。当测验要求评分者解释一个人的答案时，评分者信度是很重要的。例如创造力测验和测量性格的投射测验，在评分时都容易掺杂有主观判断的成分。因此在评分前，评分者必须经过相当专门的训练，这样评定的分数才不至于波动大大。考察评分者信度的方法是，随机抽取相当份数的试卷，由两位评分者按记分规则分别给分，然后根据每份试卷的两个分数计算其相关系数，即得评分者信度。一般要求在成对的受过训练的评分者之间一致性应该达0.90以上，才认为评分是客观的。

（二）效度

效度（validity）是指一个测验欲测量某种心理特征的准确程度。一个有效度的测验，测量的结果必然是该测验要测得的东西。任何一种测量工具都有一定的目的和使用范围。尺是用来测量长度的，秤是用来测量重量的。用秤来测量重量是有效的，用它来测量长度便是无效的。同样，智力测验只能用来测量智力，用它来测量性格，那便是无效的。因此，在使用测验时，一定要预先了解测验的功能和它的使用范围。

确定一个测验效度的方法，通常是以一群人在该测验上的得分和另一个效度标准求相关，以其相关系数的大小来表示效度。以智力测验为例，通常用下列方法来确定一个智力测验的效度。（1）与标准的智力测验求相关。一般是与斯坦福—比纳量表相比较，求其相关系数。因为斯坦福—比纳量表是被以往的研究所肯定了的。（2）与学生在校的成绩求相关。因为在条件（如年龄、环境等）相同的情况下，聪明者比愚笨者的作业成绩要好。（3）与学生就业后的成绩求相关。如果相关系数高，则该测验的效度就高。效度系数越高（0.80以上），则预测效果越高。这种效度是用来预测将来行为的，因而称为预测效度（predictive validity）。还有一种效度叫构想效度（construct validity），它是根据某种心理学理论构想而建立的。

有效度的测验能测量出我们要测的东西，它所测量的东西显然不是随意可变的。因此，有效度的测量也常常具有信度。但是，有信度的测验不一定是有效度的。例如，测量脑袋的大小作为智力的高低，这种测量是很有信度的，因为用一根皮尺以同样的方法每次测量的结果都是相同的。但是脑袋的大小不是智力的有效测量，因为它与学生成就或智力测验上的得分之间没有任何联系。

（三）常模

个人接受测验所得到的分数还只是原始分数，它本身并没有任何实际意义，只有把它同别人在该测验上得到的分数进行比较，才能判断其优劣高低。为了使原始分数有意义，同时为了使不同的原始分数可以比较，在编制测验时必须建立解释原始分数的参照标准。这种作为参照标准的分数分布就是常模（norm）。

常模的建立是一个相当复杂的过程。一般经过下列几个步骤：先是根据测验适用对象的某种特质，如年龄、性别或受教育水平等确定一个总体；然后从具有这些特质的总体中随机抽取一群被试作为样本，实施测验；对样本施测后所得的分数加以统计整理，得出平均值和标准差等统计量，即可作为该总体在该项测验上的常模。

测验编制大多会为年龄、性别或受教育程度等不同的总体建立几组常模，以作为不同被试的比较标准。心理测验中常见的常模有以年龄为样本建立的年龄常模（几乎所有的智力测验都建立有一组组的年龄常模）、以年级为样本建立的年级常模、以地区为样本建立的地区性常模和以全国样本建立的全国性常模。

除了信度、效度和常模，在编制测验时还必须规定一定的实施程序，包括如何发卷、收卷，如何对被试说明，如何解答问题，如何控制时间，如何记分等，这些都必须在测验手册中明确加以规定

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：关于心理学书籍的阅读方法

后一篇：过来人眼里的大学校园

新浪BLOG意见反馈留言板　欢迎批评指正