pandas(三):correlation和covariance

标签:
it |
分类: 利用python进行数据分析 |
1、首先介绍一下“相关系数(correlation)”和"协方差(covariance)"的定义,即描述特性:
method:{'pearson','kendall','spearman'},目前'kendall'不能用;
min_perods:为求corr,每对columns最小的元素个数;
other:{dataframe,series}
drop:将index缺失值丢掉,不进行计算;default为“计算所有”;
min_periods:最小所需元素个数;
correlation(相关系数):描述两个随机变量的线性相关关系;
covariance(协方差):描述随机变量相互关联的一个特征数;
2、pandas中cov和corr的求解方法:
- DataFrame.corr(method='pearson',min_periods=1)
#求解每对Series之间的corr,将np.nan排出在外
- DataFrame.corrwith(other,axis=0,drop=False)#求解
frame与frame之间,或frame与series之间corr
-
DataFrame.cov(min_periods=None)#计算series之间的协方差,去掉np.nan值
3、实例