0
点赞
收藏
分享

微信扫一扫

经典网络(Yolo)再现,全内容跟踪


经典网络(Yolo)再现,全内容跟踪_人脸检测


经典网络(Yolo)再现,全内容跟踪_目标检测_02

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

经典网络(Yolo)



今天接着上一篇的内容继续,内容简单明了,希望可以给您带来一些帮助,消除炎热夏天带来的一丝丝燥热,谢谢!




今天首先给大家带来“YOLO”!也被上一篇“Faith”读者说对了,在此也感谢大家的关注与阅读,O(∩_∩)O谢谢


YOLO

经典网络(Yolo)再现,全内容跟踪_计算机视觉_03

看到这个封面,相信很多很多都阅读过,其实这是一篇“基于回归方法的深度学习目标检测算法”的经典之作,如果兴趣的您,可以再一次阅读。

经典网络(Yolo)再现,全内容跟踪_人脸检测_04

会不会有朋友认为YOLO的缩写是You Only Live Once???O(∩_∩)O,其实是You Only Look Once

经典网络(Yolo)再现,全内容跟踪_计算机视觉_05

相比于之前介绍的几个网络,明显高于之前说的几个简单目标检测网络。下面来一个YOLO V2的宣传片!有兴趣的您,可以自己去做一个模型玩一玩,其实过程很不错!(“计算机视觉战队”微信平台的​​人脸检测与识别技术(怎么去创新?)​​也有简单的Demo。)


回归正题,开始说内部的内容!

经典网络(Yolo)再现,全内容跟踪_目标检测_06

经典网络(Yolo)再现,全内容跟踪_人脸检测_07

经典网络(Yolo)再现,全内容跟踪_人脸检测_08

经典网络(Yolo)再现,全内容跟踪_目标检测_09

我自己来总结下YOLO:

YOLO网络的结构和在之前得模型比较类似,主要是最后两层的结构,卷积层之后接了一个4096维的全连接层,然后后边又全连接到7*7*30维的张量上。实际上这个7*7就是划分的网格数,现在要在每个网格上预测目标两个可能的位置及这个位置的目标置信度和类别,也就是每个网络预测两个目标,每个目标的信息有4维坐标信息(中心点坐标+长宽),1个目标的置信度,还有类别数20(因为在VOC数据集上,所以是20),总共就是(4+1)*2+20=30维的张量。这样就可以利用前面4096维的全连接映射特征直接在每个网格上回归处目标检测需要的信息(BBClass)。

Result

经典网络(Yolo)再现,全内容跟踪_计算机视觉_10


AttentionNet

经典网络(Yolo)再现,全内容跟踪_人脸检测_11

经典网络(Yolo)再现,全内容跟踪_目标检测_12

经典网络(Yolo)再现,全内容跟踪_人脸检测_13

其实整个过程也是比价间的明了,不断去选择BB 的对角点,改变BB的尺寸大小。

经典网络(Yolo)再现,全内容跟踪_计算机视觉_14

经典网络(Yolo)再现,全内容跟踪_目标检测_15

经典网络(Yolo)再现,全内容跟踪_目标检测_16


经典网络(Yolo)再现,全内容跟踪_计算机视觉_17



最近也在整理资料,后期将分享在平台共享专栏!

经典网络(Yolo)再现,全内容跟踪_人脸检测_18

(先让它有点神秘感)


未完待续!

举报

相关推荐

0 条评论