0
点赞
收藏
分享

微信扫一扫

LabVIEW机器视觉系统中的图像畸变、校准和矫正

做个橙梦 2024-07-24 阅读 36

目录

1.R-CNN(区域卷积神经网络)2014

在这里插入图片描述

​ R-CNN首先从输入图像中选取若干(例如2000个)提议区域(如锚框也是一种选取方法),并标注它们的类别和边界框(如偏移量)。 然后,用卷积神经网络对每个提议区域进行前向传播以抽取其特征。 接下来,我们用每个提议区域的特征来预测类别和边界框。

R-CNN包括以下四个步骤:

  1. 对输入图像使用选择性搜索算法来选取多个高质量的提议区域。这些提议区域通常是在多个尺度下选取的,并具有不同的形状和大小。每个提议区域都将被标注类别和真实边界框;
  2. 选择一个预训练的卷积神经网络,并将其在输出层之前截断。将每个提议区域变形为网络需要的输入尺寸,并通过前向传播输出抽取的提议区域特征;
  3. 将每个提议区域的特征连同其标注的类别作为一个样本。训练多个支持向量机对目标分类,其中每个支持向量机用来判断样本是否属于某一个类别;
  4. 将每个提议区域的特征连同其标注的边界框作为一个样本,训练线性回归模型来预测真实边界框。

总结

  • 使用启发式搜索算法来选择锚框
  • 使用预训练模型来对锚框抽取特征
  • 训练一个SVM来对类别分类
  • 训练一个线性回归模型来预测边缘框偏移

兴趣区域(RoI)池化层

  • 给定一个锚框&#
举报

相关推荐

0 条评论