加载中…
个人资料
Yode
Yode
  • 博客等级:
  • 博客积分:0
  • 博客访问:594,545
  • 关注人气:250
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

常用统计量--yode总结

(2008-09-30 10:52:35)
标签:

统计量

it

分类: 数学之美

 

(1)均值(Mean): 均值代表一个变量的中心或者集中趋势.计算公式:

常用统计量--yode总结;

(2)标准差(standard deviation:std Dev):找到了数据的中心后,单纯以均值来刻画数据并非尽善尽美,还应该考察数据分部的疏密程度,即考察素有数据相对于中心分部的疏密程度,如果都紧密地集中在中心的周围,说明均值这个中心是刻画全部数据的鲜明代表,否则如果数据仅是比较松散的分部在 中心的周围,哪么仅以均值来说明数据特征就不具有代表性,因此,中心和关于中心的疏密程度共同作用,才使得人们对数据有一个全面的了解.样本的标准差就是用来表示某变量所有取值的离散程度的统计量,其数学定义为:

常用统计量--yode总结   修正的标准差为常用统计量--yode总结常用统计量--yode总结

(3)方差 variance

公式为常用统计量--yode总结

方差也是表示变量取值离散程度的统计量,它的数学定义是标准差的平方.

(4)最小值(Minimum) 最大值(Maximum) 总和(Sum) 可以通过最大值和最小值来了解变量的取值范围,这对从总体上把握数据是非常有用的,总和也是一种把握变量总体取值的手段

(5)全距(Range) 全距也称为极差,是数据的最大值与最小值之间的绝对差,全距是刻画某变量所有取值离散程度的一个统计量,在相同样本容量的情况下的两组数据,全距大的一组数据要比全距小的一组数据更分散,当全距非常小时,则意味着数据基本都集中在一起.

(6)峰度(kurtosis) 当了解诶了变量取值的中心和疏密程度后,还需要了解变量取值的分布形态从而把握数据整体特征,人们一般对数据的正态分布形态比较熟悉,因此在刻画一变量取值的分布形态时,通常与正太分布相比较..分布形态可以从素具分布的陡缓程度来描述,峰度就是描述某变量所有取值分布形态陡缓程度的统计量.


(7)偏度(skewness)也是用来刻画数据分布形态的,它是描述某变量所有取值分布形态的对称性的统计量

常用统计量--yode总结

(8)均值标准误差(standard error of mean S.E. Of Mean) 我们知道样本数据来自总体的,样本的描述统计量可以反映总体数据的特征,但由于抽样问题,使得样本数据不一定能够完全准确反映总体,可能与总体的真实值之间存在一顶的差异.样本均值作为抽样样本的平均数与总体均值之间存在差异,进行若干次抽样就会得到若干个不同的样本均值,它们与总体均值行之间或多或少的差异,均值标准误差就是描述这些样本均值与总体均值之间平均差异程度的统计量.

补充几个:

1.众数(Mode)

将数据按从大到小顺序排列后,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。

2.中位数(Median)

将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,(N+1)/2;

当样本数为偶数时,N/2

与此类似的还有:

四分位数(Quartitles)、百分位数(Percentile)、十分位数(Decile)

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有