质与量相关

标签:
质与量相关相关系数统计指标上海安脉教育 |
分类: 统计指标 |
质与量的相关是指一列变量为等比或等距的测量数据,另一列变量是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关,包括:点二列相关,二列相关及多系列相关。
一、点二列相关
(一)适用资料
如果两列变量中有一列为等距或等比的测量数据而且其总体分布为正态,另一列变量只是名义上的变量,而实际上是按事物的性质划分两类的变量。如性别可分男、女,选择答案的是、否,生命状态的生死等,这类变量被称作二分名义变量。有时一个变量是双峰分布,也可划分为名义变量,如,文盲与非文盲,文盲指识字极少,可规定一个界限,就识字量来说可能形成双峰分布状态。
点二列相关多用于编制是非题测验时评价测验内部一致性等问题。这类测验题每题只有两个答案,答对得分,答错不得分,这时统计整个测验的得分,则得到一列等距或等比性质的连续变量,而每一题目的“对”“错’’就成为二分名义变量,欲求每一题目与总分的相关(这称为每一题目的区分度),就要应用点二列相关。
(二)公式及计算
计算点二列相关的公式是:
式中 http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0413.gif 是与一个二分变量对偶的连续变量的平均数。 http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0414.gif 是与另一个二分变量对偶的连续变量的平均数。p与q是二分变量各自所占的比率。P+q=1。St是连续变量的标准差。点二列相关系数的取值在—1.00至1.00之间。相关越高,绝对值越接近1.00。
二、二列相关
二列相关适用的资料是两列均属于正态分布。但其中一列变量为等距或等比的测量数据,另一列变量虽然也呈正态分布,但它被人为地划分为两类。例如健康状态可视为正态分布,但将其分为健康与不健康两类,再如学习成绩也可视为正态分布,仍可依一定标准将其划分为好、差两类或及格不及格两类等等。
二列相关在试验中常用于对项目区分度指标的确定。有时某一项目(或称某一题目)根据一定的得分划分为对、错或通过、不通过两类时,因某一项目可得不同的分数,这些分数的分布为正态,只是人为地依一定标准将它划分为两类。若是是非选择题的对错则应该用点二列相关。二者的区别主要是二分的变量是否为正态。
(二)公式及计算
计算二列相关有两个公式
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0415.gif
式中St与 http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0417.gif 是连续变量的标准差与平均数。
二列相关系数的取值在-1.00—1.00之间。绝对值越接近1.00,其相关程度越高。
三、多系列相关
多系列相关适用的资料为两列正态变量,其中一列为等距或等比的测量数据称为连续变量,另一列正态变量被人为地分成多种类别,称为名义变量。例如学习成绩可为正态变量,被人为地划分为优、良、中、差四类,思想品质也可视为正态分布的变量,划分为不同的类别等等。如果正态变量被划分为四类,则称为四列相关,分为三类则为三系列相关……
多系列相关用于处理一列正态连续变量与另一列正态的名义变量之间的一致性分析,在测验中时常用于效度检验。亦可作为双列次数分布表求相关系数的一种方法。