http://blog.sina.com.cn/kylezheng[订阅]
个人资料
我的饭否
公告
本blog致力于分享个人学习工作心得,其主要内容包括了KyleZheng个人研究学习的重点和个人爱好:数学建模、模式识别、计算机视觉、图像处理、人工智能等。除特别声明外,本blog中收录的文章为KyleZheng原创。
评论
读取中...
分类
    内容读取中…
访客
读取中...
爱心接力棒
博文
现在SNS的产品烧得到处都是,最近发现web2.0的音乐产品也是这样。不过总得来说,创意各有千秋。从这里我感受到自己在学习研究的机器学习和数据挖掘强大的应用前景。这里就我简单的体验感受说说。有的产品使用时间稍微久远,不一定及时。
1亦歌
http://www.1g1g.com
个人感觉这个网站比较炫酷,总会实现这样的效果:一天不经意地点开,突然发现一首天籁之音。酷酷的界面,感觉十分时尚。在实验室网路比较好的时候,基本上很流畅。
问题在于,似乎没有聚类算法或者学习算法分析出users的喜好,只是简单随机罗列歌曲。

2songtaste
http://www.songtaste.com/
这个网站基本上走得是类似douban的歌曲推荐模式。基于假设:大家认为好的那就是好的。不过个人感觉很多事情包括对于音乐的口味,反倒不如douban上那些精英人士推荐的有趣符合我的胃口。
3Midomi
http://www.midomi.com/
这个网站走得是技术路线。不过感觉有些单一。比较有趣的地方在于,通过随意哼
引言:
古语言:三个臭皮匠,顶个诸葛亮。很早就想过通过组合弱分类器来实现一个强分类器的问题。当学习到线性分类器以及著名的决策树之类分类器后,很容易联想到高中时代线性规划里面对不少区域的划分。要是能够找到一种方法,组合这些简单的直线方程,不就可以实现“山寨诸葛亮”的理想?

实际上,在Kearns和Valiant在1989年大作中指出了这种算法的可行性。而后,Freund在1990年以及他和Schapire在1994-1996年提出了boosting整个算法思路,似乎这种算法走到了实际应用的开端。然而直到AdaBoost被viola在其人脸识别系统中运用(2001Viola和Jones),这种方法才彻底开始暴火。在NIPS会议tutorial中,也可以看到Schapire神采奕奕的样子了。

Adaboost实际具体解决了两个问题:
怎么处理训练样本?
在AdaBoost中,每个样本都被赋予一个权重。如果 某个样本没有被正确分类,它的权重就会被提高, 反之则降低。这样, AdaBoost方法将注意力更多 地放在“难分”的样本上。
怎么合并若分类器成为一个强分类器?
强分类器表示为若干弱分类器的线性加权和形式, 准确率越高的弱学习机权重越高。

算法介绍:
Matlab2008b号称Matlab7.7,广告说是对于向量化和非向量化的区分已经不是那么明显了。直接使用for循环而不用向量化似乎效率也是可以的。但是事实胜于雄辩。这里实验了测试了一下三种方法的效率,效果明显,看来差距确实不是那么大了,但是还存在差距。
机器配置:
Intel T2080 1.73GHz 双核
内存1.5G
操作系统Windows XP sp3
Matlab 2008b (Matlab 7.7.0)
测试程序:
% Purpose :
% Caculate the squares from 1 to 10 000 in the region of int
clear all
clc

maxcount=1;
% runing period
tic;
% using tic/toc to record the time cost.
for jj=1:maxcount
        clear square
        for ii=1:10000
             square(ii)=ii^2;
        end
end
ave1=(toc)/maxcount; %direct caculating way without pre defining array

maxco

干干净净地回家了,虽然行囊里面总是会有些瑟瑟的奖状或者纪念品,但是我知道家人需要的不是这些。按某些理论来说,一年一次的面对面的沟通实在是杯水车薪,一句话“抱歉,你讲得笑话我听不懂耶”。

在那依旧潮湿依旧冰冷的株洲站外,吃了美食城的碗热气腾腾的米粉,算是到家后和煜一起的庆祝。总得来说,家乡的饭菜永远是那么的可口,家乡的妹子看上去也别样的标致吧。虽然潮湿,但是我再也不用洗完脸摸些乱七八糟的东西;虽然冰冷,但是来来往往的礼物和饭菜已让我热起来。

然 而,一来二去,我发现了。其实父母已经不再风华正茂,家乡现代化进程中的阵痛让每六个人中有一个多是下岗或者是失业,难怪那备置年货中匆匆过往的人群中鲜 见笑脸,那寒暄过后往往是对生活的抱怨或者感叹。一句春节快乐,新年快乐,或许快乐才是最关键的。可是,本命年中的我或许刚刚才做到修身--不用家里大把 大把钞票。可以自己掏钱,去看场赤壁下、看场疯狂的赛车。可是,想想省吃简用的家人在我要走的最后一天,大把给我硬食物、红包还有希望,我在想我啥时候能 给他们带来满足、带来快乐呢?

早起的鸟儿有虫吃,废话

锤子和钉子(2009-01-15 23:15)
有的时候总有那么点胡思乱想,可能是坐的时间足够久了,“屁股也能决定大脑”。于是,响应同志们的号召,借着year of ox或者是year of bull到来的机会,参加了饭局。发现原来长时间不说话,长时间看不说人话的书,开始进入所谓的geek路线了。 也就有那么几个比较差劲的笑话作为铺垫吧。
那个笑话原来是说: 在堪萨斯城有幸听到 80 多高龄的于牧师讲道。他说一年轻人要和一女孩处对象,不知如何和人接洽。于是牧师建议,说圣诞节快到了,你不如买一礼物送她吧。年轻人买了礼物送去,结果被轰走,原来他送了人家一百斤米。女孩说:你当我是饭桶?年轻人改口说:这米是送你哥的。女孩怒不可遏:骂我哥饭桶!你哥才饭桶!你给我把米背回去!!!年轻人只好把米背走,边走边骂自己饭桶。
其实说白了,还是那个“如果你只有一把锤子,你看见的所有将是钉子”。我最近老是中着魔咒般的日子,似乎也开始走上这个路线。不过也许走多了也就好了,就像当年刚刚待北京一年,回家发现开始不适应方言全部的环境一样,总想和人说普通话,回北京又想和人说方言。 末了,为了打发自己在看论文写码累了能有东西陪伴,顺便买了只冰河世纪的抱了只大榛子的松鼠为伴。

motivation
为啥呢?
Introduction
无他,看看是否体温曲线在24小时内有高有低。
discussion and results
按powerful sleep的讲法,白天要有日光照、要有体育锻炼,晚上要有黑屋。注意什么时候入睡,而不是什么时候起床。控制好每天睡觉睡下和起来的时间符合4个周期长度。当然这个周期人人不同。
防微杜渐(2008-12-09 20:16)

Sponsored by [模式识别@格致轩 ]http://hi.baidu.com/bittnt

1、一言蔽之

http://hi.baidu.com/bittnt/blog/item/eaccf7541712cd5cd0090634.html

自负就是惯于吹嘘自己的长处,同情或嘲笑他人的不足,做成功的白日梦,追忆成功往事,厌倦批评自己的谈话,乐于与杰出人物交往而吝于与平凡人物交往。
Gilbert Ryle, The Concept of Mind 1949

 

2、啥叫风险?

最近的日子里面充满了令人兴奋愉悦的地方,终于弄明白了:

什么叫好?怎么说是好呢?那就是风险最小才是好。

 

3、我的时间还长着呢?

有的时候总是习惯在新闻和新鲜事情中点来点去,生命在以某个指数模型般地消失,而手头的工作越来越多,多到自己不想动它。OK,其实看看自己以前的旧文章,原来是这样:

http://hi.baidu.com/bittnt/blog/item/7ef9d7fa1d2928deb58f310d.html

看看书,喝喝茶,写写字。

这 也许就是普林斯顿的天才们不竭的灵感来源。那个java大概也是这么出来。可惜我

Motivation

不知道有不有这种现象:

买到或借到本书,开始兴致勃勃,一发不可收拾地读下去。结果书上的习题很多都没怎么看,那些公式也好,流程图也罢,不就那么简单,嗯,懂了!其实,当翻过来仔细自己不看答案提示,完成一些题目的时候可能备受打击,那种打击迅速消食阅读理解后快感 。。。于是为了追求完成的快乐,为了追求理解的满足,我们逐渐放弃了做题。想起来的知识,不过翻翻,你看,我这不挺明白的嘛?

看完书,往往就觉得很多想法,很多话,似乎就在嘴边,就在脑子里,却就是不能以流畅的方式表达而出。真要让你用书上讲述的知识解决一些实际问题,却往往感觉无从下手。

Introduction

如果看书尤其是专业和经典的书能和看报纸,读新闻一般愉快,那么我们都可以成为圣人了,马上就看到上帝了(传说中清教徒都是为了接近上帝才搞科研).可是,翻开随机过程也好,还是红楼梦,你真的能够明白?

往往到了考试尽头,似乎通过海量题目的训练,就像愚蠢的反馈的神经网络突然变得灵气肆

有些时候,数学模型和物理世界也许有的地方并不那么融洽,相结合可能会得出一些不可思议的悖论,Gabriel喇叭就是最经典的例子。这里是另外一个例子。

  
    假设有一个无穷大的桌面,上面垂直地树立着一根有限长的金属杆。在这根金属杆的顶端用铰链连接一根无穷长的金属杆。这根无穷长的金属杆可以绕着活 动关节处上下转动。让无穷长的金属杆随重力自由活动。注意到夹角α绝对不可能小于90度,因为我们的金属杆和桌面都是理想刚体,它们不能相交、穿透。这样 的话,α只可能是90度。于是,荒唐的一幕发生了:这根无穷长的金属杆平行地悬在桌面上空,但却只有端点处这一个支撑点。


问题的疑点是:

只有一个支撑点的东西怎么可以保持直立?对于真实物理世界,这个似乎是不可能事件。

另外,如果那个角度α小于90度,显然这个杆子不可能是无穷的。

考虑到无穷这个情况,或许根本就是不存在的。另外关于漂浮的描述,个人觉得也不是很精确,也许平行的东西也会在
摩西摩西-MCMC算法(2008-10-17 19:15)
这或许是第一次为了个破方法没睡着了。MCMC,俗称马尔科夫莫特卡洛方法。
用人民群众喜闻乐见的形式说,那就是:你想去了解地面上一个奇怪的图形的面积,作为农民的你抓起手上袋子中豆子,撒向这个形状。保证豆子铺满面积,同时没有重叠。如果你的豆子足够小,豆子又没有越界或者重叠,ok你可以通过计算出撒出的豆子数量来估计图形的面积。
这算是最通俗的比喻。当然大忽悠就此满足。我不是,所以我不满足。
通过wiki,继续mining。
我手头一幅图像被污染了,有噪声。就此假定这个是加性噪声的话,那么由随机公式出发,我可以得到一个似然函数描述这个画。ok,这算是从贝叶斯中抽象出f(观察到的画 | 原来的画)。
当然我知道原来那幅画大该是啥,那么从贝叶斯出发可以假定有个Ising的模型作为先验知识,就是我能够提前知道的东西。这个东西就是那幅画大致的分布情况。算是我可以知道,f(原来的画)。
那我怎么来认识这个被污染的画呢?尤其是那些污染?常识告诉我,应该
f(原来的画|观察到的画)=f(观察到的画|原来的画)。
这样我就可以把我的原画从被污染的东西里面找到。
用认识论的知识,可以知道,这个形式化的表达