加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

[R语言统计]二项分布及其应用

(2014-05-09 22:29:16)
标签:

r语言

医学统计学

孙振球

it

二项分布

      概念:二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布就是伯努利分布。该事件发生k次的概率为:P=C(k,n)×p^(1-p)^(n-k),其中C(k,n)表示组合数,即从n个事物中拿出k个的方法数.p为事件发生的概率,k是发生的次数,其中k=1,2,3...nEk=np,方差:Dk=np(1-p)

 

6-1  某种药物治疗某种非传染性疾病的有效率为0.70,无效率为0.30。今用该药治疗该疾病患者10人,试分别计算这10人中有6人、7人、8人有效的概率(《医学统计学》,第三版,孙振球)

#源代码例6-1

dbinom(6,10,0.7)#二项分布函数

dbinom(7,10,0.7)

dbinom(8,10,0.7)

# 其中dbinom(k,n,p)中,k是发生的次数,10是共次数,p是概率

 

>#源代码例6-1

>dbinom(6,10,0.7)

[1] 0.2001209

>dbinom(7,10,0.7)

[1] 0.2668279

>dbinom(8,10,0.7)

[1] 0.2334744

># 其中dbinom(k,n,p)中,k是发生的次数,10是共次数,p是概率

 

6-2  在对13名输卵管结扎的育龄妇女经壶腹部-壶腹部吻合术后,观察其受孕情况,发现有6人受孕,试据此资料估计该吻合术受孕率的95%可信区间。

# 源代码例6-2

binom.test(6,13,p=6/13,conf.level=0.95)

 

># 源代码例6-2

>binom.test(6,13,p=6/13,conf.level=0.95)

 

    Exact binomialtest

 

data:  6 and 13

number of successes = 6, number of trials =13, p-value = 1

alternative hypothesis: true probability of success is not equal to 0.4615385

95percent confidence interval:

0.19223240.7486545

sampleestimates:

probability of success

             0.4615385

 

6-3 在观测一种药物对某种非传染性疾病的治疗效果时,用该药治疗了此种非传染性疾病患者100人,发现55人有效,试据此估计该药物治疗有效率的95%可信区间。

# 源代码例6-3

binom.test(55,100,p=0.55,conf.level=0.95)

 

6-4  已知输卵管结扎的育龄妇女实施壶腹部-壶腹部吻合术后的受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术的受孕率?

# 源代码例6-4

binom.test(9,10,p=0.55,alternative="greater")

 

># 源代码例6-4

>binom.test(9,10,p=0.55,alternative="greater")

 

    Exact binomialtest

 

data:  9 and 10

number of successes = 9, number of trials =10, p-value = 0.02326

alternative hypothesis: true probability of success is greater than 0.55

95percent confidence interval:

0.60583671.0000000

sampleestimates:

probability of success

                   0.9

 

6-5:已知某种非传染性疾病采用甲药治疗的有效率为0.60。今改乙药治疗该疾病患者10人,发现9人有效。问甲、乙两种药物的疗效是否不同?

# 源代码6-5

binom.test(9,10,p=0.6,alternative="two.sided")

 

># 源代码6-5

>binom.test(9,10,p=0.6,alternative="two.sided")

 

    Exact binomialtest

 

data:  9 and 10

number of successes = 9, number of trials =10, p-value = 0.05865

alternative hypothesis: true probability of success is not equal to 0.6

95percent confidence interval:

0.55498390.9974714

sampleestimates:

probability of success

                   0.9

 

6-6  已知某疾病采用常规治疗的治愈率约为45%。现随机抽取180名该疾病患者改用新的治疗方法进行治疗,治愈117人。问新治疗方法是否比常规疗法的效果好?

# 源代码6-6

binom.test(117,180,p=0.45,alternative="greater")

 

># 源代码6-6

>binom.test(117,180,p=0.45,alternative="greater")

 

    Exact binomialtest

 

data:  117 and 180

number of successes = 117, number of trials =180, p-value = 5.238e-08

alternative hypothesis: true probability of success is greater than 0.45

95percent confidence interval:

0.58718781.0000000

sampleestimates:

probability of success

                  0.65

 

6-7  为研究某职业人群颈椎病发病的性别差异,今随机抽查了该职业人群男性120人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病。试作统计推断。

# 源代码6-7

data67<-matrix(c(36,120,22,110),nr = 2)

chisq.test(data67)

 

># 源代码6-7

>data67<-matrix(c(36,120,22,110),nr = 2)

>chisq.test(data67)

 

    Pearson's Chi-squared test with Yates' continuity correction

 

data:  data67

X-squared = 1.4499, df = 1, p-value = 0.2285

注:此题可以采用卡方检测,没用采用书中的方法,得出p值为0.2285,不能拒绝原假设。

 

6-8  某研究者为研究某种非遗传性疾病的家族集聚性,对一社区823口人的家庭进行了该种疾病患病情况调查,所得数据资料见表6-1中的第(1),(2)栏。试分析其家族集聚性。

real.freq <- c(26,10,28,18)

p <- (10+28*2+18*3)/(82*3)

data<- dbinom(0:3,3,p)*82

K <- sum((real.freq-data)^2/data)

1-pchisq(K,2)

 

>1-pchisq(K,2)

[1] 5.297263e-10

 

 

 6-9  某学者在对某一湖沼地区的钉螺感染血吸虫的流行病学研究中,收集了钉螺标本6000只,将其分为300个群,每群20只。经检验,在这300群中发现有270个群是阳性群,问该地区钉螺血吸虫的感染率是多少?

思路:一旦发现有阳性的就停止检验,划为阳性群,因此,只有阴性群才是全部检测,此例中300个群中有270个阳性群,因此,阴性群的概率就是1-270/300,阴性群有20只钉螺,开20次方就是一只钉螺未感染的概率,与1相减即为一只钉螺感染的概率。在R中开一个数X20次方即为X(1/20)

>1-(1-270/300)^(1/20)

[1] 0.1087491

 

后面的泊松分布计量量小,略去。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有