3.定距变量——定距变量
测量两个定距变量相关系数的最常用指标是皮尔森(Pearson)相关系数(r)。(要求N≥50而且两个变量的分布应近似于正态分布。)
(常见,所以略)
需要注意极端值。极端值是非典型、不常出现的观察值。由于回归线不是由最小距离和,而是由最小距离平方和决定的,极值对回归线的斜率和相关系数的值的大小都会有很大的影响。只要有一个极值就能够改变回归线的斜率和相关系数。不言而喻,不能仅仅根据相关系数值而妄下结论。(所以在进行相关分析前先考察其散点图)
偏相关分析
在诸多相关的变量中,剔除了(控制了)其中的一个或若干个变量的影响后,两变量之间的相关关系。偏相关的概念,在管理科学、经济科学等社会科学中有着广泛的应用;而且,正确地使用它,对正确地得出相应的结论至关重要。
剔除了一个变量Z的影响后,两个变量X、Y之间的偏相关系数是

式中,
是普通样本相关系数。
4.定类变量——定距变量
两个变量中,自变量为定类变量,因变量为定距变量时,采用相关比率来测量两者间相关程度。(又称eta2系数E2)

式中,n是样本观察值总数;ni是自变量X的每组观察值数目,
;yi是因变量的数值;
是第i组因变量均值;
为因变量均值。
5.定类变量——定序变量
对一个定类变量例如性别,与一个定序变量例如收入水平关系的分析:
(1)用theta系数(θ),专门测量定类变量与定序变量间关系有无和强度,非对称关系,并且不具有消减误差比例的含义
(2)采用λ系数和Tau-y系数,即将定序变量作为定类变量处理。
6.定序变量——定距变量
处理一个定序变量例如教育水平,与一个定距变量如年均收入之间的关系,采用二种办法:
(1)将定序变量看作定类变量,采用相关比例测量法。
(2)将定序变量看作定距变量,采用γ相关系数。
小结:在分析两个变量关系时,选择哪种相关系数,主要考虑两个方面:
1、 变量的测量层次;
2、
变量关系的类别,即是对等的还是非对称的。
注意:
由于是通过抽样的方法来研究变量之间的关系,所以,当求出各类样本相关系数不为0时,并不能真正表明变量之间是相关的,还需要通过显著性检验来判别是否显著异于0.
拖了那么长的时间总算有个阶段性的结束,今后还会对其进行补充。也欢迎各位圈友补充修正。
加载中,请稍候......