加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R语言之xlsx包(一)

(2015-12-30 17:31:27)
标签:

r语言

 统计分析的时候会遇到多种格式的文件,通常情况下比较常见的就是excel,但是普通的read函数基本无法正确读取到里面的内容,所有有大神开发xlsx这个函数包。当然RODBC也可读取。
今天主要说下这个包的使用方法,下一篇会介绍这个包里,个人认为比较cool的函数。

一、xlsx函数包安装
安装xlsx之前需要有两前提包,一个是rJava,一个是xlsxjars.

install.packages("rJava")
install.packages("xlsxjars") 
install.packages("xlsx")

安装以后顺序加载就可以了,初学者偶尔会遇到一个问题,就是关于rJava,首先需要在本机安装java中的jre,同时将jre的路径地址放入到环境变量path中。
我的电脑右键-属性-高级系统设置-环境变量-系统变量中找到path编辑添加即可。
二、读取xlsx文件数据

加载好xlsx包之后就可以使用read.xlsx()函数来读取xlsx文件了。大概解释一下read.xlsx函数里的一些参数,以便大家更好的理解。

read.xlsx(file,    #不多说,指的就是你要读取的文件
sheetIndex,   #如果你的一个xlsx文件有多个sheet,那么就用它指定你想读取的sheet
sheetName=NULL,  #读取的sheet的名字
rowIndex=NULL,  #表示读取行的向量,前提是startRow,endRow没有赋值
startRow=NULL,  #从第几行开始
endRow=NULL, #从第几行结束
colIndex=NULL, #列的向量
as.data.frame=TRUE,  # 读取的数据转化成数据框,默认执行
header=TRUE,  #第一行为变量名称
colClasses=NA,  #对列设置观测量的类型,character等
encoding="unknown", ...) #编码格式

解释之后举个简单的例子

library(rJava)
library(xlsxjars)
library(xlsx)
data <- read.xlsx("../360Downloads/HotFix/data.xlsx",sheetIndex = 1,header = T,colClasses = "character")

这里有个小技巧,就是“./” 和“../”配合tab按键,当你设置默认路径以后可以这样快速找到该路径文件夹下的各种文件。

0

阅读 收藏 喜欢 打印举报/Report
后一篇:R语言之mailR包
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有