0
点赞
收藏
分享

微信扫一扫

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理

c一段旅程c 2023-10-19 阅读 54

卷积神经网络

b站视频

CNN模型的架构

图片由像素点组成,最终成像效果由背后像素的颜色数值所决定的

在这里插入图片描述
有这样的一个66的区域,0设置为黑色,1设置为白色,最终呈现的效果就很像数字7
在这里插入图片描述
cnn模型可以告诉我们这样一个 6
6的像素图是不是数字7,或者返回它属于0-9的概率分别为多少
在这里插入图片描述

Cnn 的流程

第一步 提取图片特征

在这个过程中,我们需要使用卷积核,也可以称为特征过滤器
在这里插入图片描述

提取特征的计算规则

在这里插入图片描述
垂直特征很好的被提取,而垂直特征没被提取
原因是像素图从66,降维成44,边缘特征丢失了

在这里插入图片描述
为了解决边缘特征提取的问题,可以使用padding的扩充方法,66扩充为88,扩充部分的像素值设为0,
在这里插入图片描述

第二步 最大池化

目的是将图片的数据进一步压缩,仅反应图中最突出的特点
在这里插入图片描述
66,用22的网格分成3*3,然后提取每一部分的最大值
在这里插入图片描述

第三步 扁平化处理

在这里插入图片描述
把两个3*3的像素图叠加,转化成一维的数据条
在这里插入图片描述

第四步 数据条录入全连接隐藏层

最终产生输出结果,扁平化之后的流程与ANN模型完全一致

在这里插入图片描述
全连接隐藏层:任意一个神经元都与前后层的所有神经元相连接,来保证最终的输出值是基于图片整体信息的结果

再输出阶段:可以使用sigmoid激活函数返回0,1代表该图片是否是7的概率
也可以使用Softmax函数返回它分别属于0-9的概率

举报

相关推荐

0 条评论