实现池化层的正向传播
import torch
from torch import nn
from d2l import torch as d2l
def pool2d(X,pool_size,mode='max'):
p_h,p_w = pool_size #定义池化层的高和宽
Y = torch.zeros((X.shape[0] - p_h + 1, X.shape[1] - p_w + 1))
#输入的高 - 池化层的高 + 1,没有padding没有stride,宽度一样 输入的宽-池化的宽+1
for i in range(Y.shape[0]):
for j in range(Y.shape[1]):
if mode == 'max':
Y[i, j] = X[i: i + p_h, j: j + p_w].max()
# X的窗口高-i / X的窗口宽-j,拿出来之后取max
elif mode == 'avg':
Y[i, j] = X[i: i +p_h, j: j + p_w].mean()#平均值
return Y
之前return Y的对齐地方打错了,所以算出来结果不一样
验证二维最大池化层的输出
X = torch.tensor([[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]])
print(pool2d(X,(2,2)))
打印结果
tensor([[4., 5.], [7., 8.]])
验证二维平均池化层的输出
print(pool2d(X,(2,2),'avg'))
tensor([[2., 3.], [5., 6.]])
填充和步幅
X = torch.arange(16,dtype=torch.float32).reshape((1,1,4,4))
#通道和batch size=1,长和宽是4,可以看作一个4*4的矩阵
print(X)
'''
tensor([[[[ 0., 1., 2., 3.],
[ 4., 5., 6., 7.],
[ 8., 9., 10., 11.],
[12., 13., 14., 15.]]]])
'''
#深度学习框架中的stride和padding与池化窗口的大小相同:意思是把窗口移到下一块,不会重复
pool2d = nn.MaxPool2d(3)
#3的意思是 3*3的窗口,这里3*3只能到10,其他的没有了,没有地方了,后面不够了
print(pool2d(X))
#tensor([[[[10.]]]]) 是一个1*10的标量
#填充和步幅可以手动指定
pool2d = nn.MaxPool2d(3,padding=1,stride=2)
print(pool2d(X))
'''
tensor([[[[ 5., 7.],
[13., 15.]]]])
'''
pool2d = nn.MaxPool2d((2,3),padding=(1,1),stride=(2,3))
print(pool2d(X))
'''
tensor([[[[ 1., 3.],
[ 9., 11.],
[13., 15.]]]])
'''
池化层在每个通道上的单独运算
X = torch.cat((X,X+1),1)
print(X)
'''
tensor([[[[ 0., 1., 2., 3.],
[ 4., 5., 6., 7.],
[ 8., 9., 10., 11.],
[12., 13., 14., 15.]],
[[ 1., 2., 3., 4.],
[ 5., 6., 7., 8.],
[ 9., 10., 11., 12.],
[13., 14., 15., 16.]]]])
'''
pool2d = nn.MaxPool2d(3,padding=1,stride=2)
#3*3的窗口,填充是1,步长是2
print(pool2d(X))
'''
tensor([[[[ 5., 7.],
[13., 15.]],
[[ 6., 8.],
[14., 16.]]]])