加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

中位数(3)

(2011-08-10 10:16:11)
标签:

中位数

统计指标

上海安脉

教育

分类: 统计指标
中数的概念与求法

中数,又称中点数,中位数。符号为MdMdn(英文为Median),中数是指位于一组数据中较大一半与较小一半中间位置的那个数。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据依大小顺序排列,中数恰于中间,它将数据的数目分成较大的一半和较小的一半。中数是集中量数的一种,它能描述一组数据的典型情况,在心理与教育研究工作中常有应用。

中数的求法根据数据是否分组,而有不同的方法。

()未分组数据求中数的方法

根据中数的概念,首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中数。这里又有两种不同的情况:

1.单列数目的情况。所谓单列数目是指一组数据中没有相同的,这时取处于序列中间位置的那个数为中数:如果数据个数为奇数,则取序列为第(N+1)2的那个数据为中数。如果数据个数为偶数,则取序列为第N2与第N2+1个这两个数据的均数为中数。

1   有下列9个数,依大小排列为:

       47891011121314  (N=9)

    (N+1)2=5,序列第五的数据是10,则该组数据的中数是10

2   有下列8个数,依大小排列为:

       23578101519  (N=8) 序列为N2 = 4者是7,序列为N2+1=5者为8,则其中数为(7+8)275

从以上两例可以看出,求中数不受极大值与极小值的影响,而决定中数的关键是居中的那几个数据的数值大小。

2.有重复数目的情况。所谓重复数目是指一组数据中有数值相同的数。这时计算中数的方法基本同单列数目,但当位于中间的那几个数是重复数目时,求中数的方法就比较复杂了。具体算法如下:

首先假设位于中间的几个重复数目为连续数目,取序列中上下各N2那一点上的数值为中数。

3   有以下重复数列(N9)依大小排序:

      23557771113,居中的数是7,但7是重复数,这时要将7视作连续数。N245,序列中上下各45的那一点恰是第一个7(即序列为5的那个7)的中点,而这个7的中点如何确定呢?我们知道将7视作连续数可以理解为:6575之间有三个数据分布其中,而这三个7是均匀分布在这区间之内的,可用图示如下:

http://student.zjzk.cn/course_ware/web_xlyjytjx/images/inserpic/p62.jpg

6575之间均匀分布三个数据,每一个数据占13的距离,那么可理解为第一个7落在65683这一区间内,第二个7落在 683716区间内,第三个7落在71675(实是7499.....)区间内。第一个7的中点是667,这一点就是整个序列中位居最中间的那一点,因此,该组数据的中数是667。这是重复数列为奇数的情形。如果是偶数,作法也同奇数基本相同。例如给上组数据再增加一个15,它就变为偶数的重复序列了:

2355777111315  (N10)

N25,那就是说,该组数据的中点应该是第五个数的上限,也是第六个数的下限,图示如下:

http://student.zjzk.cn/course_ware/web_xlyjytjx/images/inserpic/p63.jpg

21  重复数目求中数示意图

根据前面的计算可知位于序列中最前面那个7的上限是683,即该组数据的中数是683

从图(21),可以清楚地看到,中数是将整个数据的个数分作大的一半和小的一半,而不是将数据的值分作相等的两部分。

()次数分布表求中数的方法

一将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。其具体步骤如下,

第一步求N2,并找到N2所在的分组区间;

第二步求含有中数那一区间以下各区间的次数和(即中数组区间下限以下的累加次数)记作Fb

第三步是求N2Fb之差;

第四步求序列为第N2那一点的值。

设中数所在那一分组区间的数据次数为fMdLb为中数所在那一分组区间精确下限值。根据重复数列求中数的原理,设有fMd个数据均匀地落在距离为i的区间内,那么每个数据各占i / fMd,那么至N2这一段距离为i / fMd * (N2Fb),如果这一段距离求出后再加上该区间的精确下限值,那就是中数的值了。

求中数的公式整理如下:

Md = Lb + (N / 2 – Fb) / fMd * i  (24a)

同理,用精确上限计算可写作下式:

Md = La + (N / 2 – Fa) / fMd * i  (24b)

式中La为中数所在分组区间的精确上限Fa为该组以上各组的累加次数,i为组距。

现以表(18)所列资料计算中数如下:

分组区间

   96—

   93—

   90—

   87—

   84—

   81—

   78—

   75—

   72—

   69—

   66—

   63—

   60一

f

2

3

4

8

11

17

19

14

10

7

3

1

l

cfl

100

98

95

91

93

72

55

36

22

12

5

2

1

Cf2

2

5

9

17

28

45

64

78

88

95

98

99

100

 

(1)N/2=100/2=50

 

(2)中数所在组区间是77.5—80.5

 

(3)中数所在组以下的次数和Fb=36

      中数所在组以上的次数和Fa=45

 

(4)fmd=19    i=3

     用公式(3—4a),

     Md=77.5+(50-36)/19*3=79.7l

     用公式(3—4b),

     Md=80.5—(50-45)/19*3=79.71

 

N=Σf=100

 

二、中数的意义与应用

从中数的计算可以看出:中数是根据观测数据计算而来,不能凭主观臆定。计算简单,容易理解,中数的概念简单明白,这是它的优点。但它也有些不足,如:它反应不够灵敏,两极端数目变化,对中数不产生影响;计算中数时,不是每个数据都加入计算,受抽样的影响较大,不如平均数稳定;中数乘以总数与数据的总和不相等(只有少数情况:Md= http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0223.gif 例外);中数不能作进一步代数运算等等。因此,在一般情况下,中数不被普遍应用。但在一些特殊情况下,它的应用受到重视。这些特殊情况是:①当一组观测结果中出现两极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。区当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数而不能计算平均数。当需要快速估计一组数据的代表值时,也常用中数。

 

    了解更多请浏览:上海安脉计算机科技有限公司

                  教学质量精细化管理 

                  学校综合管理平台               

                  学校信息管理系统城域版

 

0

阅读 收藏 喜欢 打印举报/Report
前一篇:中位数(2)
后一篇:众数(1)
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有