加载中…
  
博文
标签:

r语言

 多元统计是统计学的一个重要分支,研究同时发生的多重随机变量的统计性质及各变量间的相互关系。多元统计的应用称多元分析,传统的多元分析可以看作是各个应用学科对多变量问题的研究而发展起来的各种方法的总和。其中大部分来自社会科学领域,特别是教育学和心理学,比如因子分析,主成分分析,对应分析,典型相关分析和多维标度法。还有一些方法来自早期统计学的应用实践,比如线性判别分析来源于分类学,而多元方差分析来源于农作物生长的随机试验,可以追溯到R.A.Fisher在农业试验站的工作。回归分析则起源于遗传学和优生学的研究。这种多样化的来源与实践是多元统计在很长时间内保持发展活力的重要原因。

     但是在今天,随着数据规模越来越巨大,数据分析问题的复杂程度越来越深以及对数据的储存分析所需的计算能力要求越来越高,传统的基于正态假设的,以研究数据协方差结构为主的多元统计遇到了越来越多的挑战。大部分传统的多元统计方法创造于较早的年代,能处理的数据规模有限,在计算能力上也有很大的制约。

      在传统上应用多元统计的各个学科按照各自面对的

标签:

r语言

Rattle :基于R的数据挖掘工具(1):简介和安装

1.Rattle是什么
     数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们从统计,机器学习和计算科学中寻找各种适用的方法和工具。很多专门或通用的数据软件包被先后开发出来。

     作为优秀的统计软件包,R语言也提供了强大的数据挖掘工具,但是这些工具分散在数以百计的R 包之中,而且写脚本和编程往往也会成为快速解决问题的障碍。rattle包的出现很好的解决了这个问题。

    Rattle是一个用于数据挖掘的R的图形交互界面(GUI),可用于快捷的处理常见的数据挖掘问题。从数据的整理到模型的评价,Rattle给出了完整的解决方案。Rattle和R平台良好的交互性,又为用户使用R语言解决复杂问题开启了方便之门。Rattle易学易用,不要求很多的R语言基础,被广泛的应用于数据挖掘实践和教学之中,在澳大利亚,有至少15个政府部门采用Rattle作为标准的数据挖掘工具(
标签:

r语言

包里函数ksvm()通过.Call接口,使用bsvm和libsvm库中的优化方法,得以实现svm算法。对于分类,有C-SVM分类算法和v-SVM分类算法,同时还包括C分类器的有界约束的版本。对于回归,提供了ε-SVM回归算法和v-SVM回归算法。对于多类分类,有一对一(one-against-one)方法和原生多类分类方法,下面将会有介绍。例如

> library('kernlab') #导入包

> data('iris') #导入数据集iris

> irismodel <- ksvm(Species ~ ., data = iris,

+ type = 'C-bsvc', kernel = 'rbfdot',

+ kpar = list(sigma = 0.1), C = 10,

+ prob.model = TRUE) #训练

其中,type表示是用于分类还是回归,还是检测,取决于

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有