以yolov3为例,我们做实验验证这个问题,yolov3有三种格式的分辨率输入,分别是320*320, 416*416, 608*608,验证思路是分别将这三种尺寸的图像输入网络,看推理效果有没有受到影响,另外,为了便于对照,我们再设置一些额外的网络不支持的分辨率,看现象如何。
关于图像前处理操作的流程参考下面博客:
Darknet框架解读_tugouxp的专栏-CSDN博客
320*320:
执行./image_yolov3.sh,结果如下所示,效果非常不错:
推理时间为4036ms.
416x416
改为416*416分辨率后,推理时间明显变慢了,为7666MS,并且每个物体的置信度都有所变化,这说明改变网络输入图像的尺寸,会对推理结果产生影响:
608*608:
推理时间更长了,达到了17S,这是三种分辨率中精度最高的一个。
以上说明,网络输入的图像尺寸变化情况下,不需要重新训练,因为在训练阶段的训练数据是针对这三种分辨率进行的。
现在看一种不支持的分辨率:
224*224:
不支持的分辨率,推理时间明显变短,而且推理结果很差。
192*192:
160*160:
也很差。