加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R语言读取文件夹下文件并进行合并数据生成总数据文件

(2014-06-24 16:43:10)
标签:

r语言

教育

科技

办公

分类: 生物信息

在流水化办公中,通常有格式统一的表格文件产生,但是到最后要将这一堆表格文件整合为大表却很揪心,累断手,如何用R语言进行一次性导入整合呢?

假设我们将D:/input文件夹作为需要导入的表格的存放点,文件夹内所有文件均为此次需要导入数据,那么可以用以下程序进行操作

 setwd("D:/")                                                                    #设定工作目录为D盘
 a = list.files("input")                                                       #list.files命令将input文件夹下所有文件名输入a
 dir = paste("./input/",a,sep="")                                      #用paste命令构建路径变量dir
n = length(dir)                                                                 #读取dir长度,也就是文件夹下的文件个数
 merge.data = read.csv(file = dir[1],header=T,sep=",")   #读入第一个文件内容(可以不用先读一个,但是为了简单,省去定义data.frame的时间,我选择先读入一个文件。
 for (i in 2:n){
   new.data = read.csv(file = dir[i], header=T, sep=",")
   merge.data = rbind(merge.data,new.data)
 }

#循环从第二个文件开始读入所有文件,并组合到merge.data变量中
write.csv(merge.data,file = "./input/merge.csv",row.names=F)  #输出组合后的文件merge.csv到input文件夹

 

另外,如果懒得转换为csv,在所有excel都是只有一个sheet的时候,可以用下面的命令作为读取

首先在最开头需要安装和调用package:

install.packages("XLConnect")
 library("XLConnect")

 

 然后在正文中将 merge.data = read.csv(file = dir[1],header=T,sep=",")替换为 

merge.data = readWorksheetFromFile(file = dir[i], sheet=1, header=TRUE)

 

将new.data = read.csv(file = dir[i], header=T, sep=",")替换为

 new.data = readWorksheetFromFile(file = dir[i], sheet=1, header=TRUE)

 

写入新文件除需要复杂一点,基于下面的程序,大家可以尝试改写一下:

# 读取或创建一个XLSX文件,此步相当于建立一个连接
xls <- loadWorkbook('test.xlsx',create=TRUE)
# 创建工作表
createSheet(xls,name='namesheet')
# 写入数据
writeWorksheet(xls,iris,'nameshee',
               startRow=1,startCol=1, # 数据出现的左上角位置
               header=TRUE)
# 存入硬盘,直到此步方才有文档生成
saveWorkbook(xls)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有