VGG 网络由牛津大学视觉组提出,被广泛地应用于图像视觉等相关任务中。VGG 网络证明了增加模型深度的同时配合使用小卷积核可以提高模型的分类能力。因此,VGG 网络的所有卷积层均使用步长为1的3×3 小卷积核,同时在卷积前对特征图的四周分别填充1 个像素,以保证卷积运算后的图像像素保持不变;所有池化层都采用2×2 的核,步长都为2。除了最终输出全连接层,其他各层均使用了ReLU 进行非线性映射。VGG16 模型框架如图5-1 所示。

图5-1 VGG 框架图
VGG 网络的最大创新之处在于使用多个相连的小卷积核代替5×5卷积和7×7 卷积。卷积中两个相连的3×3 卷积核可以实现5×5 的卷积核,三个相连的3×3 卷积核可以实现7×7 的卷积核,而两个3×3 的卷积核有18 个参数,一个5×5 卷积核有25 个参数。因此,小卷积核有更少的参数,能够加速网络的训练和计算,减轻过拟合,同时可以增加更多的激活层,进一步提升模型的非线性拟合能力。(https://www.xing528.com)
VGG16 模型通常根据相邻卷积层和池化层将网络划分为五个block,每个block 后面连接一个池化层,每个卷积层后面连接一个激活层。该模型每经过一个block,特征图通道数就增加一倍,特征图分辨率折半,如图5-2 所示。具体来说,block1 包含两个卷积层,每个卷积层使用64 个3×3 大小的卷积核;block2 包含两个卷积层,每个卷积层使用128 个3×3 大小的卷积核;block3 包含三个卷积层,每个卷积层使用256 个3×3 大小的卷积核;block4 包含三个卷积层,每个卷积层使用512 个3×3 大小的卷积核;block5 包含三个卷积层,每个卷积层使用512 个3×3 大小的卷积核。在卷积模块之后有两个4 096 维全连接层和一个1 000 维全连接层。

图5-2 VGG 模型结构图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
