Hellinger distance

标签:
杂谈 |
分类: 统计与机器学习 |
在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度。它是f散度的一种(f散度——度量两个概率分布相似度的指标)。Hellinger距离被定义成Hellinger积分的形式,这种形式由Ernst Hellinger在1909年引进。
目录
·1 定义
·2 性质
·3 例子
1 定义
http://upload.wikimedia.org/math/4/7/1/471512fb9e76f19a11c87ca1d102cec5.pngdistance" />
这里的dP
http://upload.wikimedia.org/math/c/0/6/c06a9ad81ee5feb94c69324908af5615.pngdistance" />
http://upload.wikimedia.org/math/9/b/4/9b419410df1d9564cd20f85e16d17729.pngdistance" />
上述等式可以通过展开平方项得到,注意到任何概率密度函数在其定义域上的积分为1。
根据柯西-施瓦茨不等式(Cauchy-Schwarz inequality),Hellinger距离满足如下性质:
http://upload.wikimedia.org/math/e/c/a/eca9dc414f5aefb639c80dfdd50e202f.pngdistance" />
对于两个离散概率分布 P=(p1,p2,...,pn)和 Q=(q1,q2,...,qn),它们的Hellinger距离可以定义如下:
http://upload.wikimedia.org/math/2/3/0/230e56543e285bd0ec30e3f5eb139ebf.pngdistance" />
上式可以被看作两个离散概率分布平方根向量的欧式距离,如下所示:
http://upload.wikimedia.org/math/3/e/9/3e9322534c0bb03fa925c5a816f93755.pngdistance" />
2. 性质
Hellinger距离的最大值1只有在如下情况下才会得到:P在Q为零的时候是非零值,而在Q为非零值的时候是零,反之亦然。
有时公式之前的系数1/2会被省略,此时Hellinger距离的范围变为从0到2的平方根。
Hellinger距离可以跟Bhattacharyya系数BC(P,Q)联系起来,此时它可以被定义为:
http://upload.wikimedia.org/math/8/8/f/88f58f4c3bd865bebf4553d1e1b47ada.pngdistance" />
Hellinger距离通常在顺序和渐进统计中使用。
3. 例子
两个正态分布P
http://upload.wikimedia.org/math/6/7/0/6704b7224fabef708d2d03d6c042eddc.pngdistance" />
两个指数分布P
http://upload.wikimedia.org/math/6/e/2/6e22b19b26a77352b5fdd8f7e27fccf5.pngdistance" />
两个威利分布P
http://upload.wikimedia.org/math/a/2/9/a29b7b321407764556d39fdfe7bdd6f2.pngdistance" />
http://upload.wikimedia.org/math/7/b/9/7b96ea424912b41f03e6efe2bbe6beab.pngdistance" />
上述内容来自wikipedia
http://en.wikipedia.org/wiki/Hellinger_distance#mw-head