加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

pandas(三):correlation和covariance

(2018-08-24 23:14:40)
标签:

it

分类: 利用python进行数据分析
1、首先介绍一下“相关系数(correlation)”和"协方差(covariance)"的定义,即描述特性:
correlation(相关系数):描述两个随机变量的线性相关关系;
covariance(协方差):描述随机变量相互关联的一个特征数;

2、pandas中cov和corr的求解方法:
  • DataFrame.corr(method='pearson',min_periods=1)  #求解每对Series之间的corr,将np.nan排出在外
          method:{'pearson','kendall','spearman'},目前'kendall'不能用;
          min_perods:为求corr,每对columns最小的元素个数;
  • DataFrame.corrwith(other,axis=0,drop=False)#求解 frame与frame之间,或frame与series之间corr   
          other:{dataframe,series}
          drop:将index缺失值丢掉,不进行计算;default为“计算所有”;

  • DataFrame.cov(min_periods=None)#计算series之间的协方差,去掉np.nan值 
          min_periods:最小所需元素个数;

3、实例


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有