皮尔森相关系数及样本线性相关系数
(2020-03-23 00:20:09)分类: 机器学习 |
本文参考: http://blog.sina.com.cn/s/blog_8820bc4d0101s88v.html
一、皮尔森相关系数的公式如下,它是两个随机变量的协方差与其标准差之积的比值。
其中协方差的公式如下:
协方差:各随机变量与其均值差之积的均值,它是判断两个随机变量是否线性相关的很好的物理量。
皮尔森相关系数:协方差有这样的特性,如果两个变量线性相关时,协方差取到最大值并且等于各自标准差乘积,皮尔森相关系数在协方差的基础上进行了标准化,及无量纲化。
二、样本线性相关系数:
它是样本的离均值差乘积和除以各自变量的离均值差平方积的几何平均数得到。
为什么不用协方差和标准差? 因为样本标准差的公式要除以n-1而不是n,样本标准差是总体标准差的无偏估计。
前一篇:特征离散化说明