标签:
杂谈 |
分类: 科研 |
首先计算样本量和效能都需利用到统计量的分布。而必须了解的是PEARSON相关系数R并非服从正态分布。这可以通过随机试验来验证上述结论。
1. FISHER Z 变换
模拟试验步骤
1.重复从bivariate normal[z1~norm(1,1), z2~norm(1,1) , 两变量之间的相关系数为0.6] 分布里抽取30对数据,计算样本相关系数。重复该步骤3000次,得出3000个样本相关系数
2.根据这3000个样本相关系数,画出相关系数的分布图和QQplot
从上图可以知道,相关系数并不服从正态分布,当系数小于0.5时大约服从正态分布,当系数大于0.5时有倾斜(skew to the left)。
Fisher 提出一个现在被称之为“Fisher’s z transformation”的转换公式, 可以将相关系数r转换为正态分布变量z. 公式如下:
z = .5[ln(1+r) - ln(1-r)]
标准误差公式为:
我们可以用上述公式对3000个样本相关系数进行转换,然后加以验证
毫无疑问,转化后的Z值符合正态分布,均值为0.69左右。
Z的理论均值和标准方差
> r.pop<-0.6
> z.pop<- .5*(log(1+r.pop) - log(1-r.pop))
> z.pop
[1] 0.6931472
> 1/sqrt(30-3)
[1] 0.1924501
通过3000个样本估算的平均值和标准方差
> mean(z)
[1] 0.7033352
> sqrt(var(z))
[1] 0.1916479
两者非常接近。我们可以利用FISHER Z的正态分布来进行下一步的样本量计算,这和单样本Z检验过程一样。这里数学推导过程省略,不加赘述。
2. 样本量和效能计算
盈哲公司网站的相关系数样本量和效能计算器(http://www.toeach.net/cn/products)可以进行相关的计算。所有计算结果均加以校正
1. FISHER Z 转换
在 r 旁填入0.6,样本量填入30,按“CALCULATE”计算键, 所得Z值为0.6931. 标准差为0.1925.
2. 根据相关系数,一类误差,和样本量大小计算效能
相关系数填入0.35, 一类误差为0.05,样本量为60, 按计算键得出的效能为0.79.
- 根据一类误差,效能和相关系数,计算样本量
相关系数填入0.35, 一类误差为0.05, 效能为0.8, 按计算键得出的样本量为62
- 根据一类误差,效能和样本量,计算最小相关系数
样本量为60, 一类误差为0.05, 效能为0.8, 按计算键得出的相关系数为0.35