Yolo v1详解及相关问题解答
(2018-04-30 21:27:49)
标签:
杂谈 |
分类: ObjectDetection |
1. Yolo v1详解,推荐一篇很详细的博客:Yolo v1详解
优点:
(a)
速度快,YOLO将物体检测作为回归问题进行求解,整个检测网络pipeline简单。在测试阶段,每张图像只预测 7*7*2 =
98 个 Box,所以速度非常快。(在titan x GPU上,在保证检测准确率的前提下(63.4% mAP,VOC 2007
test set),可以达到45fps的检测速度。)
(b)
背景误检率低。YOLO在训练过程中可利用整张图像的整体(context)信息,而Faster-Rcnn是局部图像信息。因此,若当图像背景(非物体)中的部分数据被包含在候选框中送入检测网络进行检测时,容易被误检测成物体。测试证明,YOLO对于背景图像的误检率低于fast
rcnn误检率的一半。
(c)
YOLO对于艺术类作品中的物体检测同样适用。它对非自然图像物体的检测率远远高于DPM和RCNN系列检测方法。
缺点:
(a) 漏检。每个 grid 只预测一个 类别的Bounding
Boxes,而且最后只取置信度最大的那个
Box。这就导致如果多个不同物体(或者同类物体的不同实体)的中心落在同一个网格中,会造成漏检。YOLO对相互靠的很近的物体,还有很小的群体
检测效果不好,这是因为一个网格中只预测了两个框,并且只属于一类。
(b) 位置精准性差。召回率低。由于损失函数的问题,定位误差是影响检测效果的主要原因。尤其是大小物体的处理上,还有待加强。
(c)
对测试图像中,同一类物体出现的新的不常见的长宽比和其他情况是。泛化能力偏弱。
2.
相关问题
①小目标检测效果不好的原因是:1
目标小,yolov1网络到后面感受野较大,小目标的特征无法再后面7*7的grid中体现,针对这一点,yolov2已作了一定的修改,加入前层(感受野较小)的特征;2
目标小,可能会出现在一个grid里有两种物体,但是yolov1的模型决定了一个grid只能预测出一个物体,所以就会丢失目标,针对这一点,yolov2引入了anchor的概念,一个grid有多少个anchor理论上就可以预测多少个目标。
前一篇:1x1卷积核在深度网络中的作用