Qt中QIcon图标设置（标题、菜单栏、工具栏、状态栏图标）-CFANZ编程社区

YOLOv6 是美团推出的，在这个版本里面，不再使用之前 YOLOv4 和 YOLOv5 的带 CSP 结构的 CSPDarknet-53 作为 backbone 了，而是在 RepVGG 的启发下，推出了新的 EfficientRep 作为 YOLOv6 的 backbone。

RepVGG 最重要的一点是：结构的重参数化

简单来说，在训练和推理的时候采用不同的结构，在训练的时候采用多分支结构进行训练，但是在推理的时候使用单分支，即保留了训练多分支的准确度，又兼具推理时单分支的速度。

具体来说，训练中，backbone 中使用的是 RepBlock 模块，但是在推理的时候，可以将这些 RepBlock 模块换成带 ReLU 激活函数的 3 x 3 卷积块。

RepVGG 主干在小型网络中具有更强的特征表示能力，但是随着参数和计算成本的爆炸式增长， RepVGG 在大模型中难以获得较高的性能，所以：

在小模型（n / t / s）中，使用 RepBlock
在大模型（m / l）中，使用 CSPStackRep Block

YOLOv5 和 YOLOv6 的 backbone 对比

在这里插入图片描述
最左边 YOLOv5 的 backbone 我用的是最新版本的，其中 CSP 模块是 C3 模块，然后激活函数也是 SiLU的。从上面图片可以看出来，基本上，YOLOv6 大体上的结构变化不大，但是内部的 C3 模块换成了 RepBlock 模块或者是 CspStackRep Block 模块（这取决于模型的大小）。用到的 RepBlock 模块和 CspStackRep 模块的具体结构也在右边给了出来。

值得注意的是，就和前面提到的训练和推理的解耦，训练的时候，RepBlock 和 CspStackRep Block 模块内部使用的都是 RepVGG 模块，这是一种多分支结构，可以学习到更多不同的特征。但是到了推理的时候，为了提升推理的速度，将多分支的 RepVGG 换成了单分支的 RepConv 结构。

其实也可以看出来 YOLOv6 的一个比较创新的地方就是 RepVGG 模块向 RepConv 转换的一个结构重参数化。

RepVGG(train) -> RepConv(infer)

在这里插入图片描述
对于不同的分支，重参数化的过程不一样：

3x3 Conv：直接与 BN 层进行融合
1x1 Conv：先 padding 成 3x3 Conv，然后与 BN 层进行融合
identity：先转换成 1x1 Conv，然后再转成 3x3 Conv，最后与 BN 层进行融合

3x3 Conv 层与 BN 层融合

RepConv 其实就是一个 3x3 卷积 + ReLU 激活函数，相比于普通的卷积块，少了其中的 BN 层，这是因为 Rep 的核心思想就是 Conv2D 与 DB 的融合，等效成一个 3x3 卷积。

我们知道：卷积 Conv2D 和批归一化 BN 的公式如下： $\text{Conv}(x) = W(x) + b$ $\text{BN}(x) = \gamma \cdot \frac{(x - \text{mean})}{\sqrt[]{\text{var}} } + \beta$ 按照卷积块的流程，先经过卷积层，然后是 BN 层，公式可以写成下面形式： $\text{BN}(\text{Conv}(x)) = \gamma \cdot \frac{W(x) + b - \text{mean}}{\sqrt{\text{var} } } + \beta$ 化简可以得到： $\text{BN}(\text{Conv}(x)) = \frac{\gamma }{\sqrt[]{\text{var}}}\cdot W(x) + (\frac{\gamma \cdot (b - \text{mean})}{\sqrt[]{\text{var}}} + \beta )$ 其实可以等价为一个卷积层： $W_{fused}(x) = \frac{\gamma }{\sqrt[]{\text{var}}}\cdot W(x)$ $b_{fused} = \frac{\gamma \cdot (b - \text{mean})}{\sqrt[]{\text{var}}} + \beta$ Conv 与 BN 融合的结果可以表示为： $\text{BN}(\text{Conv}(x)) = W_{fused}(x) + b_{fused}$