加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

心理学考研之项目反应理论

(2011-12-23 11:23:24)
标签:

单维性

项目反应理论

项目特征

测验

模型

杂谈

分类: 312心理学专业基础综合

  项目反应理论(item response theory)也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用。
  1.单维性假设与项目特征曲线
  (1)单维性假设
  IRT有三个假设。
  假设一:能力单维性假设——指组成某个测验的所有项目都是测量同一潜在特质;
  假设二:局部独立性假设——指对某个被试而言,项目间无相关存在;
  假设三:项目特征曲线假设——指对被试某项目的正确反映概率与其能力之间的函数关系所作的模型。
  IRT最大的优点是题目参数的不变性,即题目参数的估计独立于被试组。它假定,被试在某一试题上的成绩不受他在测验中其他试题上的成绩影响;同时,在试题上各个被试的作答也是彼此独立的,仅由各被试的潜在特质水平所决定,一个被试的成绩不影响另一被试的成绩,这就叫做局部独立性假设。IRT理论所做出的一切推论都必须以局部独立性假设为前提。
  (2)项目特征曲线(Item Characteristic Curve,简称ICC)
  项目特征函数亦称项目特征曲线(ICC),是一种根据测试所获得的考生能力参数和项目特征参数来表示考生可能答对率(成功率) 的IRT 模式的数学表示方法,同一条ICC所对应的项目参数是唯一的。
  IRT研究的一项重要工作,就是确定题目特征曲线的形态,项目反应模型除了要拟合所选定的题目特征曲线形态,还应该包括其他一些重要的特征,否则就不是一个好的模型。
  根据特征函数可画出项目特征曲线,下面以典型的Logistic三参数模型的项目特征曲线为例:
  从上图可以看出:
  1)特征曲线拐点处的斜率,即斜率的最大值。表示题目的区分度,它的值越大说明题目对受测者的区分程度越高。
  2)特征曲线上最陡的那一点所对应的θ值,表示题目的难度。
  3)特征曲线的截距,表示题目的猜测参数,它的值越大,说明不论受测者能力高低,都容易猜对本道题目。
  教育测量学研究表明,未经筛选的大被试群体的基本心理素质如智力、能力、人格特点等的分布,服从正态分布。所以,理论上被试能力取值范围为(-∞,+∞),但在实际应用中,取值范围多取[-3.00,3.00]。
  IRT的项目特征曲线就明确表示出被试能力θ与项目的关系,横轴θ,纵轴P(θ),它表示具有某种能力θ的被试答对某项目的概率P(θ)。因此,只要已知被试的能力值,就可预测出他们可能答对某个项目的概率。
  2.单参数模型、双参数模型和三参数模型
  IRT其实是许多项目反应模式的总称。常见的IRT模式按所需估计的项目参数数目可以分为一参数模型(Rash Model)、二参数模型和三参数模型,依据计分方式分成二项计分(dicotomous)与多项计分(polytomous)模式,依据适用的作答方式分成评定量表(rating scale)模式、部分计分(partial credit)模式、名义量表(nominal scale)模式等。IRT还可以按描述的素质状态分静态模型和动态模型两大类。静态模型描述被试某个时刻的素质和能力水平(不随时间变化),这种模型目前已比较成熟;动态模型则用来描述被试的内在素质、能力水平随时间变化的情况。
  IRT 的模型有Logistic模型,Rasch模型,Lord的正态卵形曲线模型等二十余种。下面以Logistic模型为例进行简要介绍:
  (1) Logistic单参数模型(难度)公式:
  其中:
  D=1.702;
  θ:受测者能力估计值;
  a:题目的区分度,它的值越大说明题目对受测者的区分程度越高;
  b:题目的难度;
  c:题目的猜测系数,它的值越大,说明不论受测者能力高低,都容易猜对;
  P(θ):能力为θ的人答对此题目的概率。
  如何选择恰当的模型进行参数估计是题库选题的关键。不同的模型具有不同的特点,适合于不同条件下的使用。就上面所列的三种模型而言:
  单参数模型比较简单,使用较为方便,但它对项目参数性质的要求较为苛刻;
  双参数模型要求项目的猜测系数较小;
  三参数模型虽然具有涵盖较多项目信息的优点,但亦给参数估计带来更为复杂的工作。
  因此,虽然关于模型选择标准现在尚无定论,不过,可以从命题方式、记分方式、参数性质、样本人数、模型的强健性、假设的满足与否等方面得到一些选题的依据。
  3.项目信息函数与测验信息函数
  信息函数是项目反应理论中用以刻画一个测试或一道试题有效性的工具,它是直接反映测验分数对学生能力估计精度的指标。项目信息函数(item information function)是IRT 的核心概念,这个基础性的概念对测验的应用领域起了诸多影响。信息函数值越大,这种估计就越精确。项目信息函数反映了不同特性(参数)的项目在评价不同被试特质水平是的信息贡献关系。
  测验信息函数则是项目信息函数的累加和,测验信息函数反映了整个测验在评价不同被试特质水平时的信息贡献关系,测验提供的信息量越大,则该测验在评价该被试特质水平时越精确。
  测验和项目信息函数有如下重要性质:
  (1)每个项目所提供的信息量是它所测被试特质水平的函数,因而项目及测验信息函数值均是针对某一被试特质水平来说的,随被试特质水平取值的不同而变化;
  (2)每个项目在某一特质水平处所能提供的信息量还受项目自身特质的影响;区分度越大、猜测可能越小,所能提供的信息量越多;
  (3)每个项目所提供的信息不受其他项目的影响,测验中各项目均独立地对测验总信息做贡献,项目信息函数具有可加性,测验信息函数等于所含全部项目的信息函数的和;
  (4)测验信息函数在某一特质水平上的值得平方根的倒数,就是该点特质水平估计值的估计标准误。
  4.项目反应理论的特点
  优点:
  (1)参数设计的科学性。IRT的题目难度参数b与被试潜特质参数θ定义在同一度量系统上,区分度参数与难度参数相互独立,故此选择与被试水平匹配的题目非常方便。
  (2)题目参数不受样本影响。按项目反应理论估计的难度、鉴别力、猜测度等题目参数,不管出自哪个常模样本,其值都是一样的。这为建设大型的题库和编制各种测验提供了方便。
  (3)信息函数概念。IRT可以提供项目的信息函数,项目信息函数进而相加得出测验信息函数。IRT测验信息函数的定义从根本上改变了测验误差分析的思想方法和技术,也为测验编制提供了一种新型的、切实可行的选题策略。
  (4)潜特质量表的可选择性。题目参数不因样本变化而变化,但随潜特质θ的度量系统变化而变化。IRT的潜特质θ量表可以任意选择,这为测验等值提供了理论基础。
  (5)估计个体能力的精确性。当代测验理论能够针对每位受试者,提供个别差异的测量误差指标,而非单一相同的测量标准误,因此能够精确推估受试者的能力估计值。
  (6)采用拟合度检验(statistic of goodness-of-fit),可以检验模型与数据是否拟合和考生反应是否异常。
  (7)在准确估计考生能力指标的同时,还考虑考生的答题模式,对于原始分相同的考生给出予不同的能力估计。
  缺点:
  (1)数学模型深奥难懂;
  (2)参数估计必需借助计算机程序实现;
  (3)参数估计需要大样本。

      咨询QQ 625143454    http://www.borenedu.cn

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有