首页 理论教育 优化ImageNet-2010网络结构的方法

优化ImageNet-2010网络结构的方法

时间:2023-06-28 理论教育 版权反馈
【摘要】:ImageNet LSVRC是一个图片分类的比赛,其训练集包括127万多张图片,验证集有5万张图片,测试集有15万张图片。值得一提的是,在2016年的ImageNet LSVRC比赛中,取得冠军的GoogNet已经达到了top-5错误率6.67%。图3.6即为Alex的CNN结构图。图3.6 Alex的CNN结构图模型的基本参数如下:输入层:224×224大小的图片,3通道。第五层卷积:3×3的卷积核256个,两个GPU上各128个。第五层Max-pooling:2×2的核。全连接层:4096维,将第五层Max-pooling的输出连接成一个一维向量,作为该层的输入。

优化ImageNet-2010网络结构的方法

ImageNet LSVRC是一个图片分类的比赛,其训练集包括127万多张图片,验证集有5万张图片,测试集有15万张图片。本节截取2010年Alex Krizhevsky的CNN结构进行说明,该结构在2010年取得冠军,top-5错误率为15.3%。值得一提的是,在2016年的ImageNet LSVRC比赛中,取得冠军的GoogNet已经达到了top-5错误率6.67%。可见,深度学习的提升空间还很巨大。

图3.6即为Alex的CNN结构图。需要注意的是,该模型采用了2个GPU并行结构,即5个卷积层都是将模型参数分为2部分进行训练的。

978-7-111-57073-8-Chapter03-7.jpg

图3.6 Alex的CNN结构图

模型的基本参数如下:

输入层:224×224大小的图片,3通道。

第一层卷积:5×5大小的卷积核96个,每个GPU上48个。

第一层Max-pooling:2×2的核。

第二层卷积:3×3卷积核256个,每个GPU上128个。(www.xing528.com)

第二层Max-pooling:2×2的核。

第三层卷积:与上一层是全连接,3×3的卷积核384个。分到两个GPU上各192个。

第四层卷积:3×3的卷积核384个,两个GPU各192个。该层与上一层连接没有经过pooling层。

第五层卷积:3×3的卷积核256个,两个GPU上各128个。

第五层Max-pooling:2×2的核。

全连接层:4096维,将第五层Max-pooling的输出连接成一个一维向量,作为该层的输入。

全连接层:4096维。

输出层(Softmax层):1000维,每一维是图片属于该类别的概率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈