加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R语言-数据的重构和整合

(2017-06-03 10:34:18)
标签:

r语言

数据分析

数据分析师培训

数据挖掘

R语言-数据的重构和整合

在数据初步处理过程中,我们时常遇到这样的问题,就是数据包含我们所要的信息,格式却与我们预期的样式不符。我们可能需要在原有数据的基础上进行处理,增加变量的个数或者对数据框进行转置和其他处理。在本节中,我们将介绍R语言的reshape2包的作用,实现数据重构和整合数据集的绝妙的万能工具。由于reshape2包未包含在R的标准安装中,在第一次使用它之前需要使用install.packages(“reashape2”)进行安装。

1.数据的融合

例如:我们想实现如下的转化,具体如下

http://cda.pinggu.org/uploadfile/image/20170602/20170602062302_10186.png

可以使用reshape2实现,数据的融合。

md<-melt(mydata,id=c("ID","Time"))

结果展示

http://cda.pinggu.org/uploadfile/image/20170602/20170602062232_55951.png

2.数据的重铸

R语言可以使用reshape2对数据将其重铸为想要的形状。

dcast()函数读取已融合的数据,并使用特定的公式和数据整合函数将融合的数据重塑。

http://cda.pinggu.org/uploadfile/image/20170602/20170602062210_13207.png

可以写成如下代码实现,

md2<-dcast(md,ID variable~Time)

结果展示

http://cda.pinggu.org/uploadfile/image/20170602/20170602062138_44329.png

若想实现融合后的数据,转化为原始数据(获取数据时就是这种格式,而非想徒劳的折腾)。

可以写成如下代码实现,

md3<-dcast(md,ID Time~variable)

结果展示

http://cda.pinggu.org/uploadfile/image/20170602/20170602062110_25308.png

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有