首页 理论教育 深度学习中的VGGNet网络解析

深度学习中的VGGNet网络解析

时间:2023-06-30 理论教育 版权反馈
【摘要】:图9-6VGGNet结构以VGG16为例,输入一幅图片,具体处理步骤如下:输入224×224×3的图片,经64个3×3的卷积核做两次卷积和ReLU,卷积后的尺寸变为224×224×64。作2×2的max pooling池化,尺寸变为56×56×128.经256个3×3的卷积核作三次卷积+ReLU,尺寸变为56×56×256。经512个3×3的卷积核作三次卷积+ReLU,尺寸变为28×28×512。与两层1×1×4096,一层1×1×1000进行全连接+ReLU(共三层)。通过Softmax输出1000个预测结果。

深度学习中的VGGNet网络解析

2014年,牛津大学计算机视觉组(Visual Geometry group)和Google Deep Mind公司的研究员一起研发出了一种新的深度卷积神经网络——VGGNet,并使用其取得了ILSVRC2014比赛分类项目的第二名,并且同时在大赛中取得了定位项目的第一名VGGNet探索了卷积神经网络的深度与其性能之间的关系,构筑了16~19层深的卷积神经网络,进一步证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,迁移到其他图片数据上的泛化性也非常好,同时拓展性也有所加强VGGNet是由卷积层、全连接层两大部分构成的,可以看成是加深版本的AlexNet,具体结构如图9-6所示。

图9-6 VGGNet结构

以VGG16为例,输入一幅图片,具体处理步骤如下:

(1)输入224×224×3的图片,经64个3×3的卷积核做两次卷积和ReLU,卷积后的尺寸变为224×224×64。

(2)作最大化池化(Max pooling)处理,池化单元尺寸为2×2,池化后的尺寸变为112112×64。

(3)经128个3×3的卷积核作两次卷积+ReLU,尺寸变为112×112×128。

(4)作2×2的max pooling池化,尺寸变为56×56×128.(www.xing528.com)

(5)经256个3×3的卷积核作三次卷积+ReLU,尺寸变为56×56×256。

(6)作2×2的max pooling池化,尺寸变为28×28×256。

(7)经512个3×3的卷积核作三次卷积+ReLU,尺寸变为28×28×512。

(8)作2×2的max pooling池化,尺寸变为14×14×512。

(9)经512个3×3的卷积核作三次卷积+ReLU,尺寸变为14×14×512。

(10)作2×2的max pooling池化,尺寸变为7×7×512。

(11)与两层1×1×4096,一层1×1×1000进行全连接+ReLU(共三层)。

(12)通过Softmax输出1000个预测结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈