首页 理论教育 深度学习与深度合成:VGGNet

深度学习与深度合成:VGGNet

时间:2023-11-18 理论教育 版权反馈
【摘要】:VGGNet获得了2014年ILSVRC比赛的分类项目的亚军和定位项目的冠军,在top5上的错误率为7.5%。VGGNet的网络结构如图5-16所示。VGGNet把网络分成了五部分,每部分都把多组3×3的卷积网络串联在一起,每部分卷积后面采用一次最大池化操作,最后面都是连接三个全连接层和一个softmax输出层。图5-16VGGNet各级别网络结构图从图中可以看出,VGGNet结构中全部使用3×3的卷积核,通过不断加深网络结构来提升性能。

深度学习与深度合成:VGGNet

VGGNet探索了卷积神经网络的深度与其性能之间的关系,通过反复的堆叠3×3的卷积核和2×2的最大池化层,构建了最深达19层卷积神经网络。VGGNet获得了2014年ILSVRC比赛的分类项目的亚军和定位项目的冠军,在top5上的错误率为7.5%。

VGGNet的网络结构如图5-16所示。VGGNet包含六种级别的网络,深度从11层到19层不等,通常使用的是VGGNet-16和VGGNet-19。VGGNet把网络分成了五部分,每部分都把多组3×3的卷积网络串联在一起,每部分卷积后面采用一次最大池化操作,最后面都是连接三个全连接层和一个softmax输出层。

图5-16 VGGNet各级别网络结构图(www.xing528.com)

从图中可以看出,VGGNet结构中全部使用3×3的卷积核,通过不断加深网络结构来提升性能。网络层数的增长并不会带来参数数量上的“爆炸”,因为连接权值等参数主要集中在最后三个全连接层中。同时,串联两个3×3卷积层相当于使用一个5×5的卷积层,串联三个3×3的卷积层相当于使用一个7×7的卷积层,即三个3×3卷积层的感受野大小相当于一个7×7的卷积层。但是三个3×3的卷积核包含的权重参数量只有一个7×7卷积核的一半左右,可见,利用多层小卷积核运算带来的好处之一是参数数量的减少。同时,前者可以有三个非线性操作(每层包括一个激活函数),而后者只有一个非线性操作,这样使得前者对于特征的学习能力更强,能够学习到更复杂的非线性关系。

由于VGGNet具备良好的特征学习能力和泛化性能,因而其在ImageNet数据集上的预训练模型(pre-trained model)被广泛应用于图像特征抽取,以解决图像分类、物体候选框生成、细粒度图像定位、图像检索等问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈