Yolo v1详解及相关问题解答_外界的眼光

http://blog.sina.com.cn/u/6536806061

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

Yolo v1详解及相关问题解答

(2018-04-30 21:27:49)

标签：

杂谈

分类： ObjectDetection

1. Yolo v1详解，推荐一篇很详细的博客：Yolo v1详解

优点：

(a) 速度快，YOLO将物体检测作为回归问题进行求解，整个检测网络pipeline简单。在测试阶段，每张图像只预测 7*7*2 = 98 个 Box，所以速度非常快。（在titan x GPU上，在保证检测准确率的前提下（63.4% mAP，VOC 2007 test set），可以达到45fps的检测速度。）

(b) 背景误检率低。YOLO在训练过程中可利用整张图像的整体（context）信息，而Faster-Rcnn是局部图像信息。因此，若当图像背景（非物体）中的部分数据被包含在候选框中送入检测网络进行检测时，容易被误检测成物体。测试证明，YOLO对于背景图像的误检率低于fast rcnn误检率的一半。

缺点：

(a) 漏检。每个 grid 只预测一个类别的Bounding Boxes，而且最后只取置信度最大的那个 Box。这就导致如果多个不同物体(或者同类物体的不同实体)的中心落在同一个网格中，会造成漏检。YOLO对相互靠的很近的物体，还有很小的群体检测效果不好，这是因为一个网格中只预测了两个框，并且只属于一类。

(b) 位置精准性差。召回率低。由于损失函数的问题，定位误差是影响检测效果的主要原因。尤其是大小物体的处理上，还有待加强。

2. 相关问题

①小目标检测效果不好的原因是：1 目标小，yolov1网络到后面感受野较大，小目标的特征无法再后面7*7的grid中体现，针对这一点，yolov2已作了一定的修改，加入前层（感受野较小）的特征；2 目标小，可能会出现在一个grid里有两种物体，但是yolov1的模型决定了一个grid只能预测出一个物体，所以就会丢失目标，针对这一点，yolov2引入了anchor的概念，一个grid有多少个anchor理论上就可以预测多少个目标。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：1x1卷积核在深度网络中的作用

新浪BLOG意见反馈留言板　欢迎批评指正