0

点赞

收藏

分享

【数之道 08】走进“卷积神经网络“，了解图像识别背后的原理

c一段旅程c 2023-10-19 阅读 54

标签: cnn 人工智能神经网络

卷积神经网络

CNN模型的架构
Cnn 的流程

b站视频

CNN模型的架构

图片由像素点组成，最终成像效果由背后像素的颜色数值所决定的

在这里插入图片描述
有这样的一个66的区域，0设置为黑色，1设置为白色，最终呈现的效果就很像数字7

cnn模型可以告诉我们这样一个 66的像素图是不是数字7，或者返回它属于0-9的概率分别为多少

Cnn 的流程

第一步提取图片特征

在这个过程中，我们需要使用卷积核，也可以称为特征过滤器
在这里插入图片描述

提取特征的计算规则

在这里插入图片描述
垂直特征很好的被提取，而垂直特征没被提取
原因是像素图从66，降维成44，边缘特征丢失了

在这里插入图片描述
为了解决边缘特征提取的问题，可以使用padding的扩充方法，66扩充为88，扩充部分的像素值设为0，

第二步最大池化

目的是将图片的数据进一步压缩，仅反应图中最突出的特点
在这里插入图片描述
66，用22的网格分成3*3，然后提取每一部分的最大值

第三步扁平化处理

在这里插入图片描述
把两个3*3的像素图叠加，转化成一维的数据条

第四步数据条录入全连接隐藏层

最终产生输出结果，扁平化之后的流程与ANN模型完全一致

在这里插入图片描述
全连接隐藏层：任意一个神经元都与前后层的所有神经元相连接，来保证最终的输出值是基于图片整体信息的结果

再输出阶段：可以使用sigmoid激活函数返回0，1代表该图片是否是7的概率
也可以使用Softmax函数返回它分别属于0-9的概率

0 条评论

关注