心理统计学讲义(2)之-中位数问题

标签:
宋体中位数数列数值频数杂谈 |
分类: 统计 |
中位数的使用条件:
1、
2、
3、
4、
中位数的计算问题:
中位数的实质是求数列中位置为中间的数值或变量值,使数列次数分为相等的两部分。在这组数列中,有一半的数据大于或等于中位数,有一半的数据小于或等于中位数。
一、当数列中无重复数值情况:
(一)、当数列的个数为奇数时,中位数在数列中的位置为N+1/2;中位数的数值为数列中N+1/2位置的那个数的数值。
(二)、当数列的个数为偶数时,中位数在数列中的位置为N+1/2;中位数的数值为数列N/2位置数的数值与数列N+1/2位置数的数值的算术平均数。
二、当数列中有重复数值情况:
(一)、当数列重复数值不在中间情况时,其中位数的算法与无重复数值中的(一)、(二)相同。
(二)、当数列重复数值位于数列中间时,用下列两个公式计算:
Md=L+[(
N/2-Fm-1)/fm]*i
Md=U-[( N/2-Fm+1)/fm]*i
L:为中位数所在组的精确下限;U:为中位数所在组的精确上限。
N:为数列中数值总的个数,也称为∑f。
fm:为中位数组数值的频数。
i:为中位数所在组的组距。
Fm-1:为中位数以前各组的数值累计次数。(向上累计,下限公式)
Fm+1:为中位数以后各组的数值累计次数。(向下累计,上限公式)
中位数公式的证明:
前提假设为中位数组所在数列的数值为均匀分布,(如气体在容器中的均匀分布一样)均匀分布式概率上一种较为常见的分布函数,它假定随机变量在某一有限区间内是均匀的,这样起概率密度函数为:
P(x)=1/b-a,当x∈[a,b]时;或P(x)=0,当x∉[a,b]时,在分组资料中,由于原始分布情况已被统计整理后资料所代替,所以只能假定中位数组中的数据位均匀分布,由此进行估算,估算值的精确度与组距大小和精确度有关,组距越小越精确,中位数精确度越高。
证明:(一):由于组距数列计算中位数具有假定性,假设组距数列中的变量值分布是均匀的,那么中位数所在组任何一段上的频数密度都应该是相等的,即等于改组的频数密度。中位数所在组的频数密度为:中位数所在组的频数除以中尉数所在组的组距。用符号表示为:中位数所在组的频数密度为fm/i;而从中位数所在组的下限至中位数这段距离上所包含的单位数(∑f/2- Fm-1)除以从中位数所在组下限至中位数这段距离(Md-L)就是这一段频数密度,它等于中位数所在组的频数密度,即:
(∑f/2- Fm-1)/ ( Md-L)= fm/i,整理得:Md=L+[(
N/2-Fm-1)/fm]*i
证明:(二):在长度为i=U-L上分布fm个变量,则单位长度上分布有fm/i个点。所以在长度(Md-L)上分布有[(Md-L)/i]* fm个点。而在长度(Md-L)内有(∑f/2- Fm-1)个点;所以 [(Md-L)/i]* fm=∑f/2- Fm-1。整理得:Md=L+[( ∑f /2-Fm-1)/fm]*i。
http://s12/middle/3fa60152h9e90e193078b&690
图1 中位数累计频数分布图
异距数列中位数的求解与等距数列一样,这是由于中位数本身性质决定的,因为中位数不受组距大小的影响。而只跟中位数所处位置有关,因此,对单项数列数据可以看做组距为1的等距或异距数列,其精确上限为:表达上限+0.5;精确下限为:表达下限-0.5.
计算中位数的步骤:
1、
2、