为了避免以卡方为基础的量度系数的弱点,统计学家已经发展出各种其他方法,其中最流行的就是减少误差比例量度法(Proportional-reduction-in-error
measures,简称PRE)
PRE数值的意义:就是用一个现象(如变量X)来预测另一个现象(如变量Y)时能够减除百分之几的误差。
PRE=(E1—E2)/E1
E1:当不知道X变量去估计Y变量时所产生的误差(全部误差)
E2:知道X变量再去估计Y变量产生的误差
E1—E2为剩余的误差
Lambda和Tau-y 系数都是具有PRE性质的系数
(4) Lambda(λ)系数
这种相关测量法也叫做Cuttman’s
coefficient of
predictability,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。
分为:对称形式——用于测量两个变量间的关系是对等的,即无自变量与因变量之分。简写成λ系数。

非对称形式——测量两个变量间的关系有自变量与因变量之分。简写成λy(x为自变量,y为因变量)

一般来说,系数在0~1之间取值,值越大表明相关程度越高。
例:性别与吸烟态度的交互分类(人)
|
态度
Y
|
性别
X
|
合计
|
|
男
女
|
|
|
赞同
反对
|
96
18
24
62
|
114
86
|
|
合计
|
120
80
|
200
|
根据λ系数公式有

因此,我们可以说,性别与对吸烟态度之间存在中等程度的相关。
Lambda相关测量法是以众数作为预测的工具,没有考虑其他的条件。如果众数都出现在频数分布表的某一行或某一列时,Lambda系数将等于0,但并不说明X和Y一定完全无关。同时,这也说明Lambda系数测量X
、Y的相关水平是较为粗糙的一种方法。因此社会学研究中有时采用Goodman和
Kruskal的 Tau-y系数。
(5) Goodman and Kruskal的Tau-y系数
这个系数的敏感度高于Lambda系数,但只适合于分析不对称的关系,属于不对称相关测量法,要求两个定类变量中有一个是自变量,有一个是因变量。Tau-y系数的值介于0—1之间,具有消减误差比例的意义,这个系数的特色是在计算时会包括所有的边缘次数和条件次数。

当X与Y不相关时,τ=0 ;当X与Y完全相关时,τ=1
。τ值具有非对称性,它是以X为自变量,用对Y的预测来定义的,所以τ值也称作τy
。
在那么多相关系数中,在进行研究时,一般选择哪一个比较好?
在定类——定类关系中,如果是不对称关系,最好选择用的是Tau-y,如果是对称的关系,则最好选择用的是Lambda系数。