加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R语言线性模型glm()logistic回归模型

(2018-06-12 20:21:09)
标签:

数据分析

数据分析师

数据科学家

R语言线性模型glm()logistic回归模型

R语言广义线性模型glm()函数
glm(formula, family=family.generator, data,control = list(…))
formula数据关系,如y~x1 x2 x3
family:每一种响应分布(指数分布族)允许各种关联函数将均值和线性预测器关联起来。
常用的family:
http://www.cda.cn/uploadfile/image/20180611/20180611070222_20110.png
binomal(link=’logit’) —-响应变量服从二项分布,连接函数为logit,即logistic回归

binomal(link=’probit’) —-响应变量服从二项分布,连接函数为probit

poisson(link=’identity’) —-响应变量服从泊松分布,即泊松回归

control:控制算法误差和最大迭代次数

glm.control(epsilon = 1e-8, maxit = 25, trace = FALSE)

 -----maxit:算法最大迭代次数,改变最大迭代次数:control=list(maxit=100)
源自
实战:
source("setwd.r")
##下面read.csv会出错,因为表头中文乱码,删掉表头,重新定义
Data=read.csv("bankloan.csv")[2:701,]
##查看前几行tail是后几行
head(Data)
colnames(Data)<-c("x1","x2","x3","x4","x5","x6","x7","x8","y")
tail(Data)
#logistic回归模型
glm<-glm(y~x1 x2 x3 x4 x5 x6 x7 x8,family = binomial(link = "logit"),data = Data)
glm
summary(glm)
###逐步寻优法 forward前向选择法backward后向选择法
logit.step<-step(glm,direction = c("both"))
summary(logit.step)

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有