SPSS—相关分析—Spearman秩相关系数

标签:
python大数据分析数据分析数据挖掘r语言 |
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
Spearman秩相关系数是一个非参数性质(与分布无关)的秩统计参数,由Spearman在1904年提出,用来度量两个变量之间联系的强弱(Lehmann and D’Abrera 1998)。Spearman秩相关系数可以用于R检验,同样可以在数据的分布使得Pearson线性相关系数不能用来描述或是用来描述或导致错误的结论时,作为变量之间单调联系强弱的度量。
数学模型
http://www.cda.cn/uploadfile/image/20180124/20180124072741_50248.png
使用场景
Spearman秩相关系数经常被称为非参数相关系数,这具有两层含义:第一,只要在X和Y具有单调的函数关系的关系,那么X和Y就是完全Spearman相关的,这与Pearson相关性不同,后者只有在变量之间具有线性关系时才是完全相关的。另外一个关于Spearman秩相关系数的非参数性的理解就是样本之间精确的分布可以在不知道X和Y的联合概率密度函数时获得。
相关系数解释
http://www.cda.cn/uploadfile/image/20180124/20180124072731_65794.png
在没有重复数据的情况下,如果一个变量是另外一个变量的严格单调函数,则Spearman秩相关系数就是 1或-1,称变量完全Spearman秩相关。注意这和Pearson完全相关的区别,只有当两变量存在线性关系时,Pearson相关系数才为 1或-1。
正的Spearman秩相关系数对应于X、Y之间单调增加的变化趋势,负的Spearman秩相关系数对应于X、Y之间单调减小的变化趋势。
显著性检验
http://www.cda.cn/uploadfile/image/20180124/20180124072724_88836.png
http://www.cda.cn/uploadfile/image/20180124/20180124072717_38224.png
例子
我们要使用下表所给出的原始数据计算一个人的 智商和其每周花在 电视上的小时数的相关性
http://www.cda.cn/uploadfile/image/20180124/20180124072710_15214.png
http://www.cda.cn/uploadfile/image/20180124/20180124072704_61995.png
http://www.cda.cn/uploadfile/image/20180124/20180124072658_91397.png
菜单
http://www.cda.cn/uploadfile/image/20180124/20180124072649_85034.png
数据集 car_sales.sav
1
2
参数设置
http://www.cda.cn/uploadfile/image/20180124/20180124072643_82413.png
结果分析
http://www.cda.cn/uploadfile/image/20180124/20180124072636_52221.png
相关系数为0.134 < 1,两变量不相关