其中http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" /> 。
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_10.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
将上式与http://www.pami.sjtu.edu.cn/people/xzj/image/lle_11.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />相结合,并采用拉格朗日乘子法,即可求出局部最优化重建权值矩阵:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_12.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
在实际运算中,http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />,如下所示:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_13.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中r是正则化参数,I是一个kxk的单位矩阵。
LLE算法的最后一步是将所有的样本点映射到低维空间中。映射条件满足如下所示:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_14.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中,http://www.pami.sjtu.edu.cn/people/xzj/image/lle_16.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的k个近邻点,且要满足两个条件,即:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_18.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中I是http://www.pami.sjtu.edu.cn/people/xzj/image/lle_24.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />。则损失函数可重写为:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_25.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中M是一个http://www.pami.sjtu.edu.cn/people/xzj/image/lle_21.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的对称矩阵,其表达式为:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_26.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
要使损失函数值达到最小,
则取Y为M的最小m个非零特征值所对应的特征向量。在处理过程中,将M的特征值从小到大排列,第一个特征值几乎接近于零,那么舍去第一个特征值。通常取第http://www.pami.sjtu.edu.cn/people/xzj/image/lle_27.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />间的特征值所对应的特征向量作为输出结果。
2
SLLE算法
Dick和Robert提出一种针对有监督的LLE算法,即SLLE。传统的LLE算法在第一步时是根据样本点间的欧氏距离来寻找
个近邻点。而SLLE在处理这一步时,增加了样本点的类别信息。SLLE的其余步骤同LLE算法是一致的。
SLLE算法在计算点与点之间的距离时,采用如下公式:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_28.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中http://www.pami.sjtu.edu.cn/people/xzj/image/lle_33.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />取为零时,此时的SLLE和LLE算法相同。
3
SLLE参数设置
SLLE算法中有4个参数需要设置,即近邻点的个数k
、输出维数m 、正则化参数r和距离参数http://www.pami.sjtu.edu.cn/people/xzj/image/lle_33.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />。k的选取在算法中起到关键因素,如果k取值太大,LLE不能体现局部特性,使得LLE算法趋向于PCA算法;反之取得太小,LLE便不能保持样本点在低维空间中的拓扑结构。本文中k没有作出进一步的改进,相当于一个经验参数,预先取值为12。
本文的输出维数m,采用类似于PCA算法求取固有维数。SLLE算法在计算每个样本点的重建权值矩阵时,都要构造一个局部协方差矩阵http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />,可以通过如下式子求出该样本点的输出维数。
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_35.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中
为http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的特征值,且以从大到小排列。对于每个样本点,都需要计算一次样本点的输出维数。所有点输出维数的平均值规定为样本的输出维数。
正则化参数r可以取一个特别小的值,或者采用自适应调整的方法得到。当采取自适应调整的办法来选定r的值。对于每个样本点,都要校正http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />矩阵,此时正则化参数采取如下式子:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_37.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中
为http://www.pami.sjtu.edu.cn/people/xzj/image/lle_9.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的最小的
个特征值。
距离参数http://www.pami.sjtu.edu.cn/people/xzj/image/lle_33.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />是一个经验参数。在求取点间的距离时,http://www.pami.sjtu.edu.cn/people/xzj/image/lle_33.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />可以增加不同类点之间的距离,从而增加类类之间的距离。
4
SLLE的测数数据处理
设训练样本为http://www.pami.sjtu.edu.cn/people/xzj/image/lle_42.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />为测试样本的集合。主要算法分为三步:
(1)选取一个http://www.pami.sjtu.edu.cn/people/xzj/image/lle_45.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的k个近邻点,此时还时采用dijkstra距离,但是不能像SLLE算法那样加上样本点的类别信息。
(2)求http://www.pami.sjtu.edu.cn/people/xzj/image/lle_45.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />与其k个近邻点间的权值系数,且满足以下条件:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_46.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中
是http://www.pami.sjtu.edu.cn/people/xzj/image/lle_45.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的k个近邻点,
是http://www.pami.sjtu.edu.cn/people/xzj/image/lle_45.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />与其近邻点
之间的权值。
(3)计算http://www.pami.sjtu.edu.cn/people/xzj/image/lle_45.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的输出向量
:
http://www.pami.sjtu.edu.cn/people/xzj/image/lle_51.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />
其中http://www.pami.sjtu.edu.cn/people/xzj/image/lle_53.GIFlinear embedding (LLE)局部线性嵌入(降维)" TITLE="Locally linear embedding (LLE)局部线性嵌入(降维)" />的输出向量。
参考文献:
[1] Sam T. Roweis and
Lawrence K. Saul. Nonlinear Dimensionality Reduction by Locally
Linear Embedding, Science, Dec 22 2000:2323-2326
[2] Lawrence K.Saul, Sam
T.Roweis. An Introduction to Locally Linear Embedding.
http://www.cs.toronto.edu/~roweis/lle/, 2001
[3] Lawrence K.Saul, Sam
T.Roweis. Think Globally, Fit Locally: Unsupervised Learning of Low
Dimensional Manifolds. Journal of Machine Learning Research 4(2003)
119-155
[4] Dick de Ridder, Olga
Kouropteva, Oleg Okun, et al. Supervised locally linear embedding.
Artificial Neural Networks and Neural Information Processing,
ICANN/ICONIP 2003 Proceedings, Lecture Notes in Computer Science
2714, Springer, 333-341
[5] Kouropteva O, Okun O
& Pietik?inen M. Classification of handwritten digits using
supervised locally linear embedding algorithm and support vector
machine. Proc. of the 11th European Symposium on Artificial Neural
Networks (ESANN'2003), April 23-25, Bruges, Belgium,
229-234
[6] Kouropteva O, Okun O
& Pietik?inen M. Supervised Locally Linear Embedding Algorithm
for Pattern Recognition. IbPRIA 2003: 386-394