Expert Search之一（EM算法）_梁斌

http://blog.sina.com.cn/u/1497035431

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

Expert Search之一（EM算法）

(2012-08-15 15:27:04)

标签：

杂谈

以下是实验设计

设计一个一维的数据，14个数据，7个成一组，一个高斯分布，整体数据隐含了2个高斯分布。

系统最初给出第一个数属于z0的概率0.9，最后一个数属于在z1的概率0.9，其余数据不可判定。

迭代到最后，自动识别前7个数属于z0，后7个数属于z1。

实验代码

include "stdio.h"

#include "stdlib.h"

#include "stdint.h"

#include "math.h"

double PI = 3.1415926;

double Gauss(const double px,const double mu,const double csigma)

{

double val = sqrt(2*PI*csigma);

val = 1/val;

val = val*exp(-pow(px-mu,2)/(2*csigma));

return val ;

}

int main(void)

{

double x[] = {1.5,1.8,1.9,2.0,2.1,2.2,2.5, 3.0,3.9,3.9,4.0,4.1,4.1,5.0};

int m = sizeof(x)/sizeof(double);

const int k = 2;

double fei[k] ;

double mean[k] ;

double mao[k] ;

double probability_x[][2]={{0.9,0.1},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.5,0.5},{0.

1,0.9}}; // first make the 1.5 belong to z0 ,wihle 5.0 belong to z1

bool improve_large = false;

int step = 0;

do{

//E-step

for(int j=0;j<k&&step!=0;++j)

{

for(int i=0;i<m;++i)

{

probability_x[i][j] = Gauss(x[i],mean[j],mao[j])*fei[j]/ ( Gauss(x[i],mean[0],mao[0])*fei[0]+ Gauss(x[i],mean[1],mao[1])*fei[1] );

}

//M-step

for(int j=0;j<k;++j)

{

fei[j] = 0.0;

double sum_prob = 0.0;

for(int i=0;i<m;++i)

{

sum_prob += probability_x[i][j];

}

fei[j] = sum_prob / m;

}

for(int j=0;j<k;++j)

{

mean[j] = 0.0;

double weight = 0.0;

double sum_prob = 0.0;

for(int i=0;i<m;++i)

{

weight += x[i]*probability_x[i][j];

sum_prob += probability_x[i][j];

}

mean[j] = weight/sum_prob;

}

for(int j=0;j<k;++j)

{

mao[j] = 0.0;

double weight = 0.0;

double sum_prob = 0.0;

for(int i=0;i<m;++i)

{

weight += (x[i]-mean[j])*(x[i]-mean[j])*probability_x[i][j];

sum_prob += probability_x[i][j];

}

mao[j] = weight/sum_prob;

}

printf("********************%d*************************\n",step++);

printf("%f,%f,%f\n",fei[0],mean[0],mao[0]);

printf("%f,%f,%f\n",fei[1],mean[1],mao[1]);

for(int i=0;i<m;++i)

{

printf("%f\t%f\n", probability_x[i][0],probability_x[i][1]);

}

printf("***********************************************\n");

}while(!improve_large && step<100);

return 0;

}

参考 Andrew NG CS299的混合高斯模型，

网易公开课地址：http://v.163.com/special/opencourse/machinelearning.html

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：第二届penny校园西瓜节的-动员贴

后一篇：Expert search 2(推荐3篇论文）

新浪BLOG意见反馈留言板　欢迎批评指正