集成学习之Adaboost算法损失函数优化_李波

http://blog.sina.com.cn/u/5438469990

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

集成学习之Adaboost算法损失函数优化

(2017-09-13 10:04:35)

分类： MachineLearning

在集成学习原理小结中，我们讲到了集成学习按照个体学习器之间是否存在依赖关系可以分为两类，第一个是个体学习器之间存在强依赖关系，另一类是个体学习器之间不存在强依赖关系。前者的代表算法就是是boosting系列算法。在boosting系列算法中， Adaboost是最著名的算法之一。Adaboost既可以用作分类，也可以用作回归。本文就对Adaboost算法做一个总结。
1、回顾boosting算法的基本原理：

　　　　1）学习误差率e

　　　　2) 弱学习器权重系数α" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/03B1.png?rev=2.6.1

　　　　3）样本权重D

　　　　4) 结合策略

2、Adaboost算法的基本思路：

　　　　我们这里讲解Adaboost是如何解决上一节这4个问题的。

　　　　假设我们的训练集样本是

T={(x,y1),(x2,y2),...(xm,ym)}" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/007D.png?rev=2.6.1

　　　　训练集的在第k个弱学习器的输出权重为

D(k)=(wk1,wk2,...wkm);w1i=1m;i=1,2...m" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/006D.png?rev=2.6.1

　　　　首先我们看看Adaboost的分类问题。

　　　　分类问题的误差率很好理解和计算。由于多元分类是二元分类的推广，这里假设我们是二元分类问题，输出为{-1，1}，则第k个弱分类器Gk(x)" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/0029.png?rev=2.6.1

在训练集上的加权误差率为

ek=P(Gk(xi)≠yi)=∑i=1mwkiI(Gk(xi)≠yi)" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/0029.png?rev=2.6.1

　　　　接着我们看弱学习器权重系数,对于二元分类问题，第k个弱分类器Gk(x)" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/0029.png?rev=2.6.1 的权重系数为

αk=12log1−ekek" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/03B1.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化

http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/006B.png?rev=2.6.1 http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/006B.png?rev=2.6.1

　　　　为什么这样计算弱学习器权重系数？从上式可以看出，如果分类误差率ek" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/006B.png?rev=2.6.1 越大，则对应的弱分类器权重系数αk" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/03B1.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化越小。也就是说，误差率小的弱分类器权重系数越大。具体为什么采用这个权重系数公式，我们在讲Adaboost的损失函数优化时再讲。

　　　　第三个问题，更新更新样本权重D。假设第k个弱分类器的样本集权重系数为D(k)=(wk1,wk2,...wkm)" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/0029.png?rev=2.6.1

，则对应的第k+1个弱分类器的样本集权重系数为

wk+1,i=wkiZKexp(−αkyiGk(xi))" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/0069.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化

http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/03B1.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化

　　　　这里Zk" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/006B.png?rev=2.6.1 是规范化因子

Zk=∑i=1mwkiexp(−αkyiGk(xi))" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/006B.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化

http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/141/03B1.png?rev=2.6.1 集成学习之Adaboost算法损失函数优化

　　　　从wk+1,i" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Math/Italic/100/0069.png?rev=2.6.1

计算公式可以看出，如果第i个样本分类错误，则yiGk(xi)<0" role="presentation">http://mathjax.cnblogs.com/2_6_1/fonts/HTML-CSS/TeX/png/Main/Regular/141/0030.png?rev=2.6.1 ，导致样本的权重在第k+1个弱分类器中增大，如果分类正确，则权重在第k+1个弱分类器中减少.具体为什么采用样本权重更新公式，我们在讲Adaboost的损失函数优化时再讲。yiGk(xi)<0" role="presentation">

　　　　最后一个问题是集合策略。Adaboost分类采用的是加权平均法，最终的强分类器为

f(x)=sign(∑k=1KαkGk(x))" role="presentation"> 集成学习之Adaboost算法损失函数优化