【摘要】:利用MNIST数据集可以训练出卷积神经网络LeNet-5模型参数,用来识别手写体数字。输入为MNIST数据集中8 bit灰度32×32像素的图像,输出成10个节点,分别表示图像为0~9十个数字的概率。C5层就是以16个输入点和隐藏层120点进行全连接,并依指定的激活函数将输出传到下一层,接下来再和下一组隐藏层F6的84点进行全连接,最后再和输出层的10个输出点进行全连接,并正规化输出得到各输出的概率,即完成整个LeNet-5模型(网络)结构。
利用MNIST数据集可以训练出卷积神经网络LeNet-5模型参数,用来识别手写体数字。输入为MNIST数据集中8 bit灰度32×32像素的图像,输出成10个节点,分别表示图像为0~9十个数字的概率。
①卷积特征图C1层。C1层上的红点,是由输入层(INPUT)红色框(5×5个像素)乘上5×5的卷积核加总后而得,依序由输入影像的左至右、上至下共享一个卷积核进行卷积,一次移动一个像素(stride=1),如此即可产生一张特征图,而C1层共享了6组卷积核,因此产生6张28×28像素的特征图。再将影像进行池化,较常见的方式就是把相邻四点中最大的点当成新点,称为Max Pooling,同时把影像长宽都减为一半,成为S2层。(www.xing528.com)
②对S2层以16组3×3卷积核进行卷积,产生C3层,共有16组10×10像素的特征图。同样地再对C3层进行池化产生S4层,变成16组5×5像素的特征图,最后再以16组5×5卷积核把S4层的16个特征图卷积变成16个输入点,再以传统全链接神经网络进行链接。C5层就是以16个输入点和隐藏层120点进行全连接,并依指定的激活函数将输出传到下一层,接下来再和下一组隐藏层F6的84点进行全连接,最后再和输出层(OUTPUT)的10个输出点进行全连接,并正规化输出得到各输出的概率,即完成整个LeNet-5模型(网络)结构。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。