加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

样本数据的正态分布性

(2014-03-18 09:53:15)

1、  什么是正态分布

正态分布又叫高斯分布,若随机变量X服从一个数学期望为μ、方差为σ^2,概率密度函数为http://s15/mw690/001HHwRSzy6HoLMyl6m6e&690

标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ N(0,1 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。

2、  什么是二项分布?

二项分布:重复n次的伯努利实验,用ξ表示随机实验的结果。如果事件发生的概率是P,则不发生的概率q=1-pN次独立重复试验中发生K次的概率是P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k), 其中C(n, k) = n!/(k! * (n-k)!)

3、正态分布的检验:

SPSS里执行分析>描述统计>频数统计表,然后弹出左边的对话框,变量选择左边的候选变量,再点下面的图表按钮,在弹出的右边的对话框中,选择直方图,并选中包括正态曲线

 

 

设置完后点确定,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图,

 

 http://s12/mw690/001HHwRSzy6HoLhO2ZJ1b&690


上图中横坐标为待观察变量,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:

检验方法一:看偏度系数和峰度系数

偏度系数Skewness<1,峰度系数Kurtosis<1可认为近似于正态分布。

检验方法二:Q-Q图检验

 QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。图例如下:

http://s15/mw690/001HHwRSzy6HoLQEjHE7e&690

          4、  如果样本数据符合正态分布或者二项分布,则利用参数检验,否则可进行数据转换,如      对数转换,平方根转换及正切转换等,如果转换后的数据仍然完全偏离正态分布,则只能利      用非参数检验。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有