加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

个人整理-分类规则自动获取(二)

(2014-09-13 23:45:08)
标签:

ecogntion

seath

规则

自动分类

快速分类

分类: 易康整理

       在上一篇博文里,介绍了如何利用eCognition Developer将类别样本的特征值导出为Excel格式;本篇将介绍第一种分类规则自动构建的方法——SEaTH(Seperability and Thresholds),该方法基于导出的样本特征值,能够实现两两类别之间区分的最佳特征自动选择,以及特征阈值的自动确定。   

       SEaTH算法由Nassbuam于2005年提出,其初衷是用于国际原子能机构的(IAEA)核设施的检测和监测。该算法结合了高空间分辨率遥感影像目前普遍使用面向对象分类技术的现状,能够解决面向对象分类的特征选择过程所面临的问题,即海量的对象特征中究竟哪些特征在区分哪些类别时才是最有效的,同时该算法实现了对区分两两类别的显著特征的最佳阈值的计算,使得它可以作为一个规则构建工具,基于各个类别的样本对象,来构建出一套分类规则(两两类别区分),以用于面向对象的分类或者变化检测。

       SEaTH算法包括两部分,第一部分是特征优选,第二部分是特征阈值的确定。

      (1)关于特征优选

       基于类别样本的特征值,SEaTH算法采用分离度来评价两个类别在某特征上的关联程度。如下面三张图,分别表示了类别C1和C2,基于特征B、A、C的分离度分别是较差分离、部分分离和完全分离,即用特征C来区分类别C1和C2的效果最好。

http://s4/mw690/002KgeW3zy6M1d5cErVf3&690

http://s7/mw690/002KgeW3zy6M1d5owcea6&690

http://s11/mw690/002KgeW3zy6M1d5xf505a&690

 

       分离度的计算采用的是J-M(Jeffries-Matusita)距离,距离的取值范围是[0,2],0表示两个类别在某一特征上几乎完全混淆,2表示两个类别在某一特征上能够完全分开,其公式如下所示:

http://s3/mw690/002KgeW3zy6M1dO8QNk42&690

       这里的B表示巴氏距离,m1和m2表示两个类别的某特征均值, http://s9/mw690/002KgeW3zy6M1dF1cRq48&690表示两个类别的某特征标准差,巴氏距离的计算公式如下所示:

http://s3/mw690/002KgeW3zy6M1dq6M7Mb2&690

     (2)关于特征阈值的自动确定

       计算两两类别在某特征的最佳阈值,根据高斯概率分布公式:

  p(x)=p(x|C1)p(C1)+p(x|C2)P(C2)

       当p(x|C1)=p(x|C2)时,两种类别之间的混分最少,如下图所示,当对应的特征值为X1时,类别C1和C2的分离性最好:

http://s2/mw690/002KgeW3zy6M1ev5CxP11&690

       此时的X1便可作为特征阈值T,其计算公式如下所示,那么T介于m1和m2之间,n1和n2表示的类别C1和C2的样本数目,阈值T的计算公式如下所示:

http://s7/mw690/002KgeW3zy6M1eAyhP856&690

        基于以上介绍的(1)和(2),即可实现利用SEaTH算法来计算得到两两类别区分的最优特征以及对应的特征阈值。除此之外,这里就该算法的应用给出几点提示:

       提示一:该算法已经由原作者开发成功能模块,嵌入到eCongnition Developer中,如果没有正版的eCognition Developer,那么建议大家可以直接在Excel中一步步自己去计算,直接利用导出的样本特征值Excel,分别计算各个类别对应的各个特征的均值、标准差,然后再计算两两类别之间的巴氏距离和J-M距离,以及阈值T和A。

       提示二:需要注意的是SEaTH算法,衡量的是两两类别之间基于某特征的分离度,通常将两个类别之间最大J-M距离对应的特征最为最佳特征;比如耕地、林地和水体,计算得到的耕地和林地的最大J-M距离为1.8,耕地和水体的最大J-M距离为1.9,水体和林地的最大J-M距离为1.8,这是我们应用SEaTH算法的第(1)部分得到的结果,当然应用第(2)部分也可以计算得到特征阈值,但是分类的先后顺序没有确定下来,要知道分类顺序关系到分类的精度和效率(特征计算)。通常采用的是将J-M距离最大的类别区分放在前面,但是J-M距离一样的例如这里J-M距离1.8同时对应水体和林地、林地和耕地,就比较难以确定究竟先执行哪两种类别的区分了。

      提示三:J-M距离的取值范围是[0,2],对于一些特征值显著差异的两两类别,例如水体和建设用地、植被和建设用地等,J-M距离值都比较大,基本都在1.9以上,甚至接近2;但是并不是所有类别之间都是那么容易区分的,例如林地和耕地(有作物覆盖)、水体和阴影等,J-M距离可能在1.7以下甚至更低,因此当遇到这种情况时,再直接使用阈值T的计算公式,得到的计算结果就不太准确了。针对这个问题,Marpu提出的解决方式和阈值T的计算公式如下图所示:

http://s7/mw690/002KgeW3zy6M1fZEmcm46&690

          以上介绍了SEaTH算法,利用它能够在导出的类别样本特征值Excel基础上,计算得到两两类别之间区分的最佳特征以及特征阈值,特征和阈值组成了一条分类规则,此时在eCognition Developer中就可以构建类别区分规则,一条一条地去执行,从而一步步地获取类别区分的结果。 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有