加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

多元统计分析(一) 马氏距离

(2010-02-02 15:54:09)
标签:

杂谈

分类: 数学理论
当提到距离的时候,一般都会想到欧氏距离,更远一些还会想到范数,其实还有一种看不见的重要距离,那就是马氏距离。它由印度数学家马哈拉诺比斯(Mahalanobis)首先提出,所以又称为Mahalanobis Distance,是一种采样协方差来计算两点之间距离的方法。马氏距离功能强大,甚至连欧氏距离都是马氏距离的特殊情形。在了解马氏距离之前,不妨先观察下图:有两个正态分布的总体,它们的均值分别为ab,但是方差不一样,则图中的A点离哪个总体近呢?显然,A离左边的更近,A属于左边总体的概率更大,尽管Aa的欧式距离远一些。这就是马氏距离的直观意义了。

http://s4/middle/7420820c49cb80f81c693&690  

马氏距离的定义如下:
定义1XY是从均值向量为μ,协方差阵为的总体G中抽取的两个样品,定义XY两点之间的马氏距离为:
定义2X与总体G的马氏距离为:
根据马氏距离的定义,可以得到它的几个特点如下:
p      两点之间的马氏距离与原始数据的测量单位无关。
p      标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。
p      可以排除变量之间的相关性的干扰。
p      满足距离的四个基本公理:非负性、自反性、对称性和三角不等式。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有