加载中…
个人资料
felix123
felix123
  • 博客等级:
  • 博客积分:0
  • 博客访问:87,060
  • 关注人气:10
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
搜博主文章
访客
加载中…
评论
加载中…
博文
标签:

r数据挖掘

分类: R语言

> require(arules)                         #载入arules(Association Rules)

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据挖掘

分类: R语言
> require(party)  #在系统中导入party包

> #party包的全称是A Laboratory for Recursive Partytioning
> attach(WuxiWeather)   #导入WuxiWeather的数据集
> #WuxiWeather数据集主要考察每天的天气情况与空气质量之间的关系,响应值是每天的空气质量水平





The following objects are masked from WuxiWeather (position 10):

    AQI, AQL, Co, Date, HighTemp, Low
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> #R语言中使用ggplot2包进行分面绘图
> require(ggplot2)
Loading required package: ggplot2

Attaching package: ‘ggplot2’

The following object is masked _by_ ‘.GlobalEnv’:

    diamonds

> attach(diamonds)
The following objects are masked _by_ .GlobalEnv:

    x, y
> #以上操作导入ggplot2包以及diamonds数据集
> #下例按照钻石的颜色分类,对carat以及price绘制散点图
> qplot(carat,price,facets=color~.,colour=color,geom='point')
> #注意:facets参数可以设置x~y两个维度,如果只需要一个,~的后面用.作为缺失值代替

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> require(ggplot2)
Loading required package: ggplot2

Attaching package: ‘ggplot2’

The following object is masked _by_ ‘.GlobalEnv’:

    diamonds

> attach(diamonds)
The following objects are masked _by_ .GlobalEnv:

    x, y
> #geom几种不同参数的不同图形样式效果以及示例图形
> #如果数据是单维的连续性数据,则geom的默认值就是'histogram'
> #如下例:
> qplot(carat,colour='red')
stat_bin: binwidth defaulted to range/30. Use 'binwidth = x' to adjust this.
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> #在R语言中使用ggplot2包中的qplot函数绘制常用的图表
> require(ggplot2)
Loading required package: ggplot2
> #载入ggplot2包
> attach(diamonds)
The following objects are masked _by_ .GlobalEnv:

    x, y
> fix(diamonds)
> #载入diammonds数据集并查看,具体如下图
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> #创建一组随机数
> set.seed(99)
> ChineseHeight <- rnorm(1000,mean=172,sd=12)
> #假设创建的是1000个中国成年人的身高数据
> #ECDF指的是Emperical Cumulative Density Function,即累积概率密度图
> plot(ecdf(ChineseHeight),col='red')
> #以上创建的是最基本的ECDF图



阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> require(gcookbook)
>#导入gcookbook包
Loading required package: gcookbook
> View(climate)
#查看 climate数据文件
> data(climate)
#载入climate数据
> csub <- subset(climate,Source=='Berkeley' & Year>=1900)
#筛选出Berkeley这个地方从1900年开始后的数据
> csub$pos <- csub$Anomaly10y>=0
#在筛选过的数据中加入一列,用来判断是正增长还是负增长
> View(csub)
#查看一下整理过的数据集
> require(ggplot2)
#载入ggplot2包
Loading required package: ggplot2
> ggplot(csub,aes(x=Year,y=Anomaly10y,fill=pos))+geom_bar(stat='identity')
#图表X轴以年划分,
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> data(mtcars)
> #首先导入数据集mtcars
> corr <- cor(mtcars)
> #将数据集中的每个列的相关系数统计出来并保存在一个corr的参数中
> corr
> #查看corr数据结果,统计出来的相互之间的相关系数
            mpg        cyl       disp         hp        drat         wt        qsec         vs          am
mpg   1.0000000 -0.8521620 -0.8475514 -0.7761684  0.68117191 -0.8676594  0.41868403  0.6640389  0.59983243
cyl  -0.8521620  1.0000000  0.9020329  0.8324475 -0.69993811  0.7824958 -0.5
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r一般统计

分类: R语言
> require(pastecs)
> data(mtcars)
> #pastecs包的全称是Package for Analysis of Space-Time Ecological Series
> stat.desc(mtcars$mpg)
     nbr.val     nbr.null       nbr.na          min          max        range          sum       median 
  32.0000000    0.0000000    0.0000000   10.4000000   33.9000000   23.5000000  642.9000000   19.2000000 
        mean      SE.mean CI.mean.0.95          var      std.dev     coef.var 
  20.0906250    1.0654240    2.1729465  
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

r数据可视化

分类: R语言
> require(car)
> attach(mtcars)
> scatterplot(mpg~wt|am,xlab='Weight',ylab='MPG per Gallon',main='Enhanced Scatterplot with Groups',labels=row.names(mtcars))
> #通过car(Companion to Applied Regression)包中的scatterplot命令,添加一个|之后就可以添加分组变量
> scatterplot(mpg~wt|am,xlab='Weight',ylab='MPG per Gallon',main='Enhanced Scatterplot with Groups'
+ )
> #此命令可以自动生成图例,不要自己设置,labels参数可以忽略
> #用到的包car
> #用到的命令scatterplot
> #用到的数据集mtcars


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有