加载中…
个人资料
winter
winter
  • 博客等级:
  • 博客积分:0
  • 博客访问:11,403
  • 关注人气:1
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

如何计算相关系数R的样本量和效能

(2009-04-21 08:56:26)
标签:

杂谈

分类: 科研

首先计算样本量和效能都需利用到统计量的分布。而必须了解的是PEARSON相关系数R并非服从正态分布。这可以通过随机试验来验证上述结论。

1. FISHER Z 变换

模拟试验步骤

1.重复从bivariate normal[z1~norm(1,1), z2~norm(1,1) , 两变量之间的相关系数为0.6] 分布里抽取30对数据,计算样本相关系数。重复该步骤3000次,得出3000个样本相关系数

2.根据这3000个样本相关系数,画出相关系数的分布图和QQplot

pic1

从上图可以知道,相关系数并不服从正态分布,当系数小于0.5时大约服从正态分布,当系数大于0.5时有倾斜(skew to the left)。

Fisher 提出一个现在被称之为“Fisher’s z transformation”的转换公式, 可以将相关系数r转换为正态分布变量z. 公式如下:

z = .5[ln(1+r) - ln(1-r)]

标准误差公式为:

clip_image003

我们可以用上述公式对3000个样本相关系数进行转换,然后加以验证

pic2

毫无疑问,转化后的Z值符合正态分布,均值为0.69左右。

Z的理论均值和标准方差

> r.pop<-0.6

> z.pop<- .5*(log(1+r.pop) - log(1-r.pop))

> z.pop

[1] 0.6931472

> 1/sqrt(30-3)

[1] 0.1924501

通过3000个样本估算的平均值和标准方差

> mean(z)

[1] 0.7033352

> sqrt(var(z))

[1] 0.1916479

两者非常接近。我们可以利用FISHER Z的正态分布来进行下一步的样本量计算,这和单样本Z检验过程一样。这里数学推导过程省略,不加赘述。

2. 样本量和效能计算

盈哲公司网站的相关系数样本量和效能计算器(http://www.toeach.net/cn/products)可以进行相关的计算。所有计算结果均加以校正

1. FISHER Z 转换

在 r 旁填入0.6,样本量填入30,按“CALCULATE”计算键, 所得Z值为0.6931. 标准差为0.1925.

pic6

2. 根据相关系数,一类误差,和样本量大小计算效能

相关系数填入0.35, 一类误差为0.05,样本量为60, 按计算键得出的效能为0.79.

pic3

  1. 根据一类误差,效能和相关系数,计算样本量

相关系数填入0.35, 一类误差为0.05, 效能为0.8, 按计算键得出的样本量为62

pic4

  1. 根据一类误差,效能和样本量,计算最小相关系数

样本量为60, 一类误差为0.05, 效能为0.8, 按计算键得出的相关系数为0.35

pic5

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有