0
点赞
收藏
分享

微信扫一扫

李宏毅机器学习笔记3——卷积神经网络

Image Classification
把图片设成同尺寸。

image是一个模型的输入。
“y head”dimention长度决定了辨别多少种类动物。
输出的y’与y head的Cross entropy越小越好。
在这里插入图片描述
tensor张量
向量里的值代表某一个位置颜色的强度。
模型的弹性越大,越容易overfitting

观察一:
不一定要看整个图片,可能只看图片中的几个关键点就可以识别了。
在这里插入图片描述

每个neuro只需观察自己的receptive field
常见的receptive field的kernel size是3×3
receptive field之间常是重叠的,之间跨度为stride,超出正方体就补零padding
在这里插入图片描述
观察二
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
卷积层的好处
在这里插入图片描述
卷积层用在图片识别不容易overfitting,之外就不好说了。
在这里插入图片描述
Feature Map
在这里插入图片描述
receptive field数值与fitter数值相乘再相加。
Convolution
本来一个image有3个channel,通过Convolution成新图片64个channel,再继续叠:
在这里插入图片描述
对比两个观察
在这里插入图片描述
观察三
采样像素不会影像图片。
在这里插入图片描述
Pooling
pooling的结果是使得特征减少,参数减少,但pooling的目的并不仅在于此。
在这里插入图片描述
例如保留每个channel里最大值:
在这里插入图片描述
一般会做两次convolution,做一次pooling.
pooling是为了减少运算量,如果运算能力强,可不用,提高准确性。
全部的卷积神经网络(CNN)步骤
在这里插入图片描述
CNN应用playing go
围棋和图像有相似性,可看做19*19像素。
在这里插入图片描述
CNN缺点
没法处理image放大缩小旋转,同图放大可能就识别失败了。

举报

相关推荐

0 条评论