0%
TL;DR
- 本文介绍了
YOLO 系列几种高效的 backbone 设计,主要包括:VoVNet、PRN、CSPNet、ELAN、E-ELAN 等
Algorithm
1. VoVNet
- paper: https://arxiv.org/pdf/1904.09730.pdf

- 作者认为
densenet 存在问题:每一层 Conv 都使用之前所有层的输出,因此会导致当前 Conv 的 input channel 很大,输出到 output channel 却较小
- 因此,作者只在
VoVNet Block 的最后一个 Conv 才用之前所有层的输出
- 相同计算量下,效果优于
Resnet 和 DenseNet
2. PRN
3. CSPNet(YOLOV5)
4. ELAN
- paper: https://arxiv.org/pdf/2211.04800.pdf

ELAN 全称是 Efficient Layer Aggregation Network, 作者以 VoVNet 和 ResNet 做对比,VoVNet 在叠加更多 block 时表现要比 ResNet 更差,作者分析是因为 VoVNet 结构中存在过多的 transition layers,这导致在叠加 block 时最短梯度路径( the shortest gradient path )不断增加,从而使得 block 增加时训练难度上升
PRN 相比 ResNet,使用 mask 让输入只有部分 channel 通过 identity connection,丰富了梯度来源;
CSPNet 通过将 channel split,一方面增加了梯度信息(同 PRN),另一方面减少了 computational block 中的计算量;
ELAN 的思想是:搭建网络时需要考虑每一层的最短最长梯度路径,还要考虑整个网络的最长梯度路径。
5. E-ELAN(YOLOV7)