加载中…
个人资料
dengyafeng
dengyafeng
  • 博客等级:
  • 博客积分:0
  • 博客访问:147,730
  • 关注人气:374
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
访客
加载中…
好友
加载中…
评论
加载中…
留言
加载中…
博文
标签:

杂谈

发个招人贴吧

百度IDL招收实习生两名,有意者请发简历到dengyafeng at baidu dot com

 

岗位1

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

hash

object_detection

cvpr

dpm

hog

分类: 计算机视觉
这篇文章是CVPR 2013 best paper。

这篇文章的牛,主要体现在一些关键数字上,可以分类100000类别,比base line快了20000倍。
不过,美中不足的是,其单机处理一幅图像的速度,需要20s,而且,100000类mAP为0.16,看上去很美,但是距离实用还有一些距离。

这篇文章的卖点在于速度快,具体就是对于多类检测问题,检测速度可以做到和类别数目无关。

对于包含C类的物体检测而言,一个基本的框架是,训练C个分类器,对于每个候选位置,用每个分类器都判定一遍,然后做后处理融合。这样的坏处是速度太慢,处理速度和物体类别成反比(线性,算法复杂度O(C))。

这篇文章参考的base line算法是DPM模型,就是每个物体的模型由多个part(假定P个)的模型组成,每个part的模型可以看作是一个filter和该位置特征的点积(整体上可以看作是一个convolution过程),然后根据可能的part候选的位置约束确定物体的位置。在实际中,最耗时的是convolution过程,每个物体分类器的filter(对应weight)都需要和候选位置的特征进行一次点积处理,假定候选窗口数目为W
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

deep_learning

face_recognition

人脸识别

人脸检测

人脸特征点定位

分类: 人脸识别

一,人脸检测/跟踪

人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小;对于跟踪而言,还需要确定帧间不同人脸间的对应关系。

 

1,

Robust Real-time Object Detection. Paul Viola, Michael Jones. IJCV 2004.

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

object_detection

分类: 计算机视觉

这篇文章发表于CVPR2013,有人推荐过,认为其代表了Mid-level patch discovery is a hot research topic这一计算机视觉的新趋势。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

deep_learning

imagenet

hinton

分类: 机器学习
(决定以后每读一篇论文,都将笔记记录于博客上。)

这篇发表于NIPS2012的文章,是Hinton与其学生为了回应别人对于deep learning的质疑而将deep learning用于ImageNet(图像识别目前最大的数据库)上,最终取得了非常惊人的结果,其结果相对原来的state of the art好了非常多(前5选错误率由25%降低为17%)。

ImageNet目前共包含大约22000类,15兆左右的标定图像。其中,目前最常用的LSVRC-2010 contest包含1000类,1.2兆图像。本文的结果在这个测试集上得到了前五选错误率17%的结果。


下图给出了整个deep net的结构:


共包含8层,其中前5层是cnn,后面3层是全连接的网络,其中最后一层是softmax组成的输出决策层(输
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2013-06-07 15:35)
标签:

deep-learning

图片搜索

人脸搜索

分类: 计算机视觉
昨天,百度上线了新的相似图(similar image search)搜索,试了风景、人物、文字等不同类型query的效果,感觉效果非常赞。尤其对于人物搜索,返回的结果在颜色、以及姿态方面具有非常大的相似性。特别是在输入某个pose的美女图片时,会搜到一系列相近pose的美女图片,真的是宅男之福啊。本着娱乐精神,贴一个搜索结果供大家yy


我们知道这个产品底层的技术是余凯老师领导的百度多媒体图像组做的,但是到底是如何做到的,我相信大家一定都非常好奇。在这里,我按照自己的理解,讲讲我认为

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
转发自知乎:
http://www.zhihu.com/question/19833708?group_id=15019075#1657279

由于作者匿名,只好默默感谢了。


多层的好处是可以用较少的参数表示复杂的函数。
在监督学习中,以前的多层神经网络的问题是容易陷入局部极值点。如果训练样本足够充分覆盖未来的样 本,那么学到的多层权重可以很好的用来预测新的测试样本。但是很多任务难以得到足够多的标记样本,在这种情况下,简单的模型,比如线性回归或者决策树往往 能得到比多层神经网络更好的结果(更好的泛化性,更差的训练误差)。
非监督学习中,以往没有有效的方法构造多层网络。多层神经网络的顶层是底层特 征的高级表示,比如底层是像素点,上一层的结点可能表示横线,三角; 而顶层可能有一个结点表示人脸。一个成功的算法应该能让生成的顶层特征最大化的代表底层的样例。如果对所有层同时训练,时间复杂度会太高; 如果每次训练一层,偏差就会逐层传递。这会面临跟上面监督学习中相反的问题,会严重欠拟合。

2006年,hinton提出了在非监督数据上建立多层神经网络的一个有效方法,简单的说
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

machine-learning

deep-learning

neural-network

分类: 机器学习
最近deep learning大火,不仅仅受到学术界的关注,更在工业界受到大家的追捧。在很多重要的评测中,DL都取得了state of the art的效果。尤其是在语音识别方面,DL使得错误率下降了大约30%,取得了显著的进步,现在如果哪个做语音识别的公司没用DL,都不好意思打招呼了,相信后续这种状况还会延伸到图像和自然语言处理等其它领域。

deep learning本身算是machine learning的一个分支,简单可以理解为neural network的发展。大约二三十年前,neural network曾经是ML领域特别火热的一个方向,但是后来确慢慢淡出了,原因包括以下几个方面:
1,比较容易过训练,参数比较难tune;
2,训练速度比较慢,在层次比较少(小于等于3)的情况下效果并不比其它方法更优;
所以中间有大约20多年的时间,神经网络被关注很少,这段时间基本上是svm和boosting算法的天下。但是,一个痴心的老先生hinton,他坚持了下来,并最终(和其它人一起bengio、
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

杂谈

人脸识别

分类: 机器学习
几天前,我在微博上面问了一个问题“一个两类分类问题,5400个训练样本,600个测试样本(测试、训练样本不交叠),特征10000维,用RBF核的SVM训练,得到的模型在测试集上测试误差为50%(和随机猜想一样)。而如果改用线性核,则准确率可以达到80%。这正常吗?”

包括余凯、老师木、山世光在内的很多大牛都热情回答,在此一并感谢,就不一一点名啦。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

计算机视觉

人脸检测

adaboost

分类: 人脸检测
周末没上微博,今天一来,发现微博上大家对adaboost进行了热烈的讨论。
讨论源于@老师木 这个神人抛了三个问题,无数大牛争相回答。这三个问题是:
1,adaboost不易过拟合的神话。2,adaboost人脸检测器好用的本质原因,3,真的要求每个弱分类器准确率不低于50%。

关于第一个和第二个问题,包括@ICT山世光 &
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有