0
点赞
收藏
分享

微信扫一扫

目标检测文章综述

JamFF 2022-03-17 阅读 73

论文源地址

1. 与其他综述的不同之处

1.对目标检测技术演变的全面回顾
该论文回顾了从上世纪90年代到2019年的400多篇的论文。
2.深入探索的关键技术和最近的技术现状
对“multi-scale detection”,“bounding box regression”等这些技术进行了深度的探讨
3.对检测加速技术的综合分析
20年来目标检测历史上的加速技术进行了广泛的回顾

2.传统的目标检测

1.Viola Jones Detectors
VJ探测器通过结合“积分图像”、“特征选择”和“检测级联”三种重要技术,显著提高了其检测速度。

2.HOG Detector
3. Deformable Part-based Model (DPM)
DPM遵循“分治治之”的思想,训练可以简单地视为学习分解对象的正确方法,推理可以被认为是对不同对象部分的检测的集合。例如,检测“汽车”的问题可以被认为是对其窗口、车身和车轮的检测。

3.基于CNN的两阶段探测器

1.RCNN
优点:相比于传统方法,其精度增加了很多。
缺点: 速度很慢
2.SPPNet
优点:改良了RCNN,速度上快了很多。
缺点:首先,训练仍然是多阶段的,其次,SPPNet只对其全连接的层进行了微调,而忽略了之前的所有层.
3.Fast RCNN
虽然Fast-RCNN成功地集成了R-CNN和SPPNet的优点,但其检测速度仍然受到方案检测的限制
4.Faster RCNN
Faster-RCNN的主要贡献是引入了区域提案网络(RPN),从而实现了几乎没有任何开销的区域提案。
5.Feature Pyramid Networks
由于CNN通过其正向传播自然地形成了一个特征金字塔,因此FPN在检测各种尺度的物体方面显示出了巨大的进步。更加有利于对对象的定位。

4.基于CNN的一阶段探测器

1.YOLO

2.SSD
SSD的主要贡献是引入了多参考和多分辨率检测技术,这显著提高了一级探测器的检测精度,特别是对一些小物体的检测。
3.RetinaNet

5.多尺度检测技术的发展

  1. Feature pyramids + sliding windows
    是专门设计来检测具有“固定纵横比”的物体(如面孔和直立的行人),通过简单地建立特征金字塔和滑动固定大小的检测窗口。对于“变化纵横比”的物体并没有考虑到。
  2. Dtection with object proposals
    指一组可能包含任何对象的与类无关的候选框。
  3. Deep regression
    基于深度学习特征直接预测边界框的坐标
  4. Multi-reference/-resolution detection
    它的主要思想是预先定义一组参考框(a.k.a.anchor boxes)在不同位置的不同大小和纵横比的图像,然后根据这些参考框预测检测框

三 速度

3.1级联检测

级联检测可提升"大场景下的小物体检测"的速度

3.2Lightweight Network Design(轻型网络设计)

  1. factorizing convolutions(分解卷积)
    两种方式,将一个大的卷积核分成几个效地卷积核,例如,我们可以将一个7x7的滤波器分解成三个3x3的滤波器,在那里它们共享相同的接受域,但后者更有效。另一个例子是将一个k×k滤波器分解为一个k×1滤波器和一个1×k滤波器,这对于非常大的滤波器可能更有效
    2.Group Convolution(组卷积)
    组卷积是将特征通道划分成不同的组,然后对不同的组进行卷积,从而减少卷积层参数的数量。
    3.Depth-wise Separable Convolution(深度可分离卷积)
    假设我们有一个带有d个卷积核的卷积层和一个c个通道的特征层。每个卷积核的大小为k×k。对于深度可分离卷积,首先将每个k×k×c卷积核分割成c片,每个片大小为k×k×1,然后在每个卷积核的每个通道中单独进行卷积。最后,使用一些1x1的卷积核来进行维数变换,以便最终的输出应该有d个通道。通过使用深度可分离卷积,。这一想法最近已被应用于目标检测和细粒度分类

4.特征融合

先解释两个名词:
https://zhuanlan.zhihu.com/p/41682204(详细的解释)
等变性 equivariant
通俗解释:对于一个函数,如果你对其输入施加的变换也会同样反应在输出上,那么这个函数就对该变换具有等变性。
不变性 invraiant
通俗解释:对于一个函数,如果对其输入施加的某种操作丝毫不会影响到输出,那么这个函数就对该变换具有不变性。
在CNN中,较深的层可以有更好的不变性,更加有利于对物体的分类,较浅的层有更好的等变性,更加有利于对物体的定位检测。因此,在CNN模型中整合深度和浅层特征有助于提高不变性和等变性。

举报

相关推荐

0 条评论