宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

本文转载自:

http://www.cnblogs.com/lillylin/p/6207292.html

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)


 

目录

作者及相关链接文章的选择原因方法概括方法细节相关背景补充实验结果与相关文章的对比总结

 


 

作者

 

【计算机视觉】目标检测之ECCV2016-风君子博客

 

intro: ECCV 2016 Oralarxiv: http://arxiv.org/abs/1512.02325paper: http://www.cs.unc.edu/~wliu/papers/ssd.pdfslides: http://www.cs.unc.edu/%7Ewliu/papers/ssd_eccv2016_slide.pdfgithub: https://github.com/weiliu89/caffe/tree/ssdvideo: http://weibo.com/p/2304447a2326da963254c963c97fb05dd3a973githubMXNet): https://github.com/zhreshold/mxnet-ssdgithub: https://github.com/zhreshold/mxnet-ssd.cppgithubKeras): https://github.com/rykov8/ssd_keras

文章的选择原因

性能好,single stage

【计算机视觉】目标检测之ECCV2016-风君子博客

方法概括

文章的方法介绍

SSD主要用来解决目标检测的问题(定位+分类),即输入一张待测图像,输出多个box的位置信息和类别信息测试时,输入一张图像到SSD中,网络输出一个下图最右边的tensor(多维矩阵),对该矩阵进行非极大值抑制(NMS)就能得到每个目标的位置和label信息【计算机视觉】目标检测之ECCV2016-风君子博客

Figure2的最右图的1th-20th Channel表示类别,每一个Channel上的map对应原图,last 4 channel的每一个map分别对应x,y,w,h的偏移量。最后4个通道可以确定一个box的位置信息,前20个通道确定类别信息。

方法的pipeline和关键点

【计算机视觉】目标检测之ECCV2016-风君子博客

方法细节

 

模型结构

【计算机视觉】目标检测之ECCV2016-风君子博客

多尺度特征图

【计算机视觉】目标检测之ECCV2016-风君子博客

【计算机视觉】目标检测之ECCV2016-风君子博客

用来预测的卷积滤波器

【计算机视觉】目标检测之ECCV2016-风君子博客

defaul box

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

groundTruth的标定,损失函数

【计算机视觉】目标检测之ECCV2016-风君子博客

default box和尺度的选择

【计算机视觉】目标检测之ECCV2016-风君子博客

 

SSD的训练——Hard negative mining

【计算机视觉】目标检测之ECCV2016-风君子博客

SSD的训练——数据扩增

【计算机视觉】目标检测之ECCV2016-风君子博客

相关背景补充

Atrous算法(hole算法)

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

FPS/SPF, Jaccard overlap

【计算机视觉】目标检测之ECCV2016-风君子博客

二类分类/检测常用的评价标准 (recall, precision, f-measure, accuracy, error, PR曲线和ROC曲线,AP,AUC)

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

ImageNet多类分类的评价标准

【计算机视觉】目标检测之ECCV2016-风君子博客

ImageNet单目标检测的评价标准

【计算机视觉】目标检测之ECCV2016-风君子博客

ImageNet(多)目标检测的评价标准

【计算机视觉】目标检测之ECCV2016-风君子博客

验结果

PASCAL VOC2007 test detection结果

【计算机视觉】目标检测之ECCV2016-风君子博客

使用数据扩增、多尺度default box、atrous算法的对比效果

【计算机视觉】目标检测之ECCV2016-风君子博客

SSD512在某类Ianimals)上的检测性能可视化

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

SSD对于目标大小的敏感性实验

【计算机视觉】目标检测之ECCV2016-风君子博客【计算机视觉】目标检测之ECCV2016-风君子博客

SSD使用的feature map的个数对结果的影响

【计算机视觉】目标检测之ECCV2016-风君子博客

示例结果

【计算机视觉】目标检测之ECCV2016-风君子博客

时间和速度

【计算机视觉】目标检测之ECCV2016-风君子博客

 

与相关文章的对比

 

原始R-CNN方法的变形

【计算机视觉】目标检测之ECCV2016-风君子博客

Faster R-CNN和SSD对比

【计算机视觉】目标检测之ECCV2016-风君子博客

YOLO和SSD对比

【计算机视觉】目标检测之ECCV2016-风君子博客

总结

文章贡献

SSD, a single-shot detector for multiple categories faster than YOLO, accurate as Faster R-CNN)The
core of SSD
 is predicting category scores and box offsets for a fixed set of default
bounding boxes
 using small convolutional filters applied to multiple
feature maps
 from different layersExperimental evidencehigh
accuracy, high speed, simple end-to-end training single shot)

SSD对于其他方法的改进的关键点

Using a small convolutional filter to predict object categories and offsets in bounding box locationsUsing separate predictors filters) for different aspect ratio detectionsUsing multiple layers for prediction at different scales apply these
filters to multiple feature maps to perform detection at multiple stages)