超几何分布是概率与统计里面常见的分布,但有许多高中生朋友对这个名称很陌生。其实在高中数学中概率与统计部分涉及到超几何分布的非常多,几乎有50%的题型都和它有关。常见的就是小球的问题,一共有某某个球,有某某个红球和某某个白球,随便拿出几个球等等,类似的问题求期望与方差,大多关系到超几何分布……
最开始超几何分布是由产品抽样调查引出的,比如有N件产品,其中有M件不合格,现随便抽出n件做检查,发现其中有x件不合格,那么x就服从超几何分布。由于决定该分布的有N、M、n,所以为了简单起见,人们把这样的x服从超几何分布记做x~H(n,M,N)。
因此,有些老师就根据产品检验的问题编出小球的问题,比如,今有球N个,其中有M个红球,N-M个白球,任意取n个球,一系列的问题就来了,先问问取到1个红球的概率,再问问取到x个红球的概率的公式,后来又让你把x所有可能的情况列个表,最后一个问就是算算期望与方差,当然这里M、N都给的是具体的数据,这样就能方便的算出期望与方差,毕竟数据不只一个,算错的可能性还是比较高的,还是研究研究期望与方差的具体公式吧。今天我要把期望与方差的公式计算出来,省着一个个算,既麻烦有费力……
首先,不厌其烦地说一下期望与方差的关系,以便清晰思路。期望用E表示,方差用D表示,一般把自变量记做ξ,如果对于结果为ξ的概率为Pξ那么,其期望为Eξ=∑ξ*Pξ,方差为Dξ=∑(ξ-Eξ)^2*Pξ,另外还有一个常见的量叫做标准差,一般用σ表示,σξ=√Dξ,根据方差的概念,可知:
Dξ=∑(ξ-Eξ)^2*Pξ
=∑(ξ^2+Eξ^2-2*ξ*Eξ)*Pξ
=∑(ξ^2*Pξ+Eξ^2*Pξ-2*Pξ*ξ*Eξ)
=∑ξ^2*Pξ+Eξ^2*∑Pξ-2*Eξ*∑Pξ*ξ
因为∑Pξ=1而且Eξ=∑ξ*Pξ
所以Dξ=∑ξ^2*Pξ-Eξ^2
而∑ξ^2*Pξ,表示E(ξ^2)
所以Dξ
=E(ξ^2)-Eξ^2
根据题意,如果所得到的次品数(或者说取到红球的个数)为ξ,很容易算出这种情况的概率Pξ=C{ξ,M}*C{n-ξ,N-M}/C{n,N},因为不清楚n与M哪个大,也就是不知道ξ的最大值应该是多少,所以“∑”的上标还须要讨论,如果n>M,那么,这种情况ξ的最大值是M,如果n≤M,那么,这种情况ξ的最大值是n,可以发现ξ的最大值是min(n,M),所以,数学期望应该是,
Eξ=∑{ξ=0,min(n,M)}ξ*C{ξ,M}*C{n-ξ,N-M}/C{n,N}
=1/C{n,N}*∑{ξ=0,min(n,M)}ξ*C{ξ,M}*C{n-ξ,N-M}
=1/C{n,N}*∑{ξ=0,min(n,M)}ξ*M!/ξ!/(M-ξ)!*C{n-ξ,N-M}
=1/C{n,N}*∑{ξ=1,min(n,M)}M!/(ξ-1)!/(M-ξ)!*C{n-ξ,N-M}
=M/C{n,N}*∑{ξ=1,min(n,M)}C{ξ-1,M-1}*C{n-ξ,N-M}
其他先不考虑,首先观察一下右面的和式,发现每项都是两个组合数的积,而且两个组合数中所选的数之和都等于n-1,该和式有一定意义,它表示在N个球中拿走一个红球,再在剩下的球中任取n-1个球,看看取到红球的个数有多少种情况,红球的个数可能是0、1、2、…、min(n,M)-1,把以上所有可能的情况数都加到一起,根据分类计数原理,所有的情况数加到一起就等于在N-1个球中任取n-1个球的情况总数,即C{n-1,N-1}
所以,
Eξ=M/C{n,N}*C{n-1,N-1}
=M*n!*(N-n)!/N!*(N-1)!/(n-1)!/(N-n)!
=M*n/N
如果要计算方差,可以根据公式Dξ
=E(ξ^2)-Eξ^2计算,问题就在于E(ξ^2)的计算,根据题意,
E(ξ^2)=∑{ξ=0,min(n,M)}ξ^2*C{ξ,M}*C{n-ξ,N-M}/C{n,N}
当然,有
E(ξ^2)-Eξ=∑{ξ=0,min(n,M)}ξ^2*C{ξ,M}*C{n-ξ,N-M}/C{n,N}-∑{ξ=0,min(n,M)}ξ*C{ξ,M}*C{n-ξ,N-M}/C{n,N}
E(ξ^2)-Eξ=∑{ξ=1,min(n,M)}ξ*(ξ-1)*C{ξ,M}*C{n-ξ,N-M}/C{n,N}
E(ξ^2)-M*n/N=1/C{n,N}*∑{ξ=2,min(n,M)}(ξ-1)*M!/(ξ-1)!/(M-ξ)!*C{n-ξ,N-M}
E(ξ^2)-M*n/N=1/C{n,N}*∑{ξ=2,min(n,M)}M!/(ξ-2)!/(M-ξ)!*C{n-ξ,N-M}
E(ξ^2)-M*n/N=M*(M-1)/C{n,N}*∑{ξ=2,min(n,M)}(M-2)!/(ξ-2)!/(M-ξ)!*C{n-ξ,N-M}
E(ξ^2)-M*n/N=M*(M-1)/C{n,N}*∑{ξ=2,min(n,M)}C{ξ-2,M-2}*C{n-ξ,N-M}
同理,观察右边的和式,也同样有一定的意义,它表示先在N个球中拿走2个红球,之后再在其中取n-2个球,计算一下取到红球个数的情况总数之和,同样红球个数可以是0、1、2、…、min(n,M)-2,根据加法原理,这些情况总数就等于在N-2个球中任取n-2个球的情况总数,即C{n-2,N-2},那么就有,
E(ξ^2)-M*n/N=M*(M-1)/C{n,N}*C{n-2,N-2}
E(ξ^2)=M*n/N+M*(M-1)/C{n,N}*C{n-2,N-2}
所以,根据方差公式,
Dξ =
M*n/N+M*(M-1)/C{n,N}*C{n-2,N-2}-M^2*n^2/N^2
= M*n/N-M^2*n^2/N^2+M*(M-1)*n!*(N-n)!*(N-2)!/N!/(n-2)!/(N-n)!
= M*n/N-M^2*n^2/N^2+M*(M-1)*n*(n-1)/N/(N-1)
= M*n(N-M*n)*(N-1)/N^2/(N-1)+M*N*(M-1)*n*(n-1)/N^2/(N-1)
=M*n*[(N-M*n)*(N-1)+N*(M-1)*(n-1)]/N^2/(N-1)
=M*n*(N^2-N-M*N*n+M*n+M*N*n-M*N-n*N+N)/N^2/(N-1)
=M*n*(N^2-M*N-n*N+M*n)/N^2/(N-1)
=M*n*(N-M)*(N-n)/N^2/(N-1)
看似方差非常不好记,其实只需记住一部分就可以了,因为超几何分布的极限可以看成是二项分布,如果不合格率是p,合格率是q(p+q=1),那么p=M/N,q=(N-M)/N,那么超几何分布的方差可以写作n*p*q*(N-n)/(N-1)。当然对于超几何分布,数学期望就等于n*p了,与二项分布非常相似……
有些人可能迷茫在“∑{ξ=2,min(n,M)}C{ξ-2,M-2}*C{n-ξ,N-M}≡C{n-2,N-2}”上,其实该和式有比较严密的证法,我们可以找到更一般的情况来证明上述恒等式,比如我们知道
(x+1)^a*(x+1)^b=(x+1)^(a+b)
将该等式展开,得
(∑{i=0,a}C{i,a}*x^i)*(∑{j=0,b}C{j,b}*x^j)=∑{k=0,a+b}C{k,a+b}*x^k
比较等式两边x^n的系数,得
∑{l=0,min(a,n)}C{l,a}*C{n-l,b}=C{n,a+b}
恰当的代入参数,就是我们须要的结果……
以上就是超几何分布的期望与方差的计算过程,网上也能查得到类似的方法,也许会有更简单的办法,就不一一总结了……总之,我们要记住,条条大路通罗马。
加载中,请稍候......