【摘要】:例如,对于一个96×96像素的图像,假设已经学习得到了400个定义在8×8输入上的特征,每一个特征和图像卷积都会得到一个×=7921维的卷积特征,由于有400个特征,所以每个样例都会得到一个7921×400=3168400维的卷积特征向量。学习一个拥有超过300万特征输入的分类器十分不便,并且容易出现过拟合。这种聚合的操作就叫作池化,有时也称为平均池化或者最大池化,如图3.5所示。图3.5 池化特征示意图
在通过卷积获得了特征之后,下一步希望利用这些特征去做分类。理论上讲,人们可以用所有提取得到的特征去训练分类器,例如Softmax分类器,但这样做面临计算量的挑战。例如,对于一个96×96像素的图像,假设已经学习得到了400个定义在8×8输入上的特征,每一个特征和图像卷积都会得到一个(96-8+1)×(96-8+1)=7921维的卷积特征,由于有400个特征,所以每个样例都会得到一个7921×400=3168400维的卷积特征向量。学习一个拥有超过300万特征输入的分类器十分不便,并且容易出现过拟合。
为了解决这个问题,首先回忆一下,之所以决定使用卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述大的图像,一个很自然的想法就是对不同位置的特征进行聚合统计,例如,人们可以计算图像一个区域上的某个特定特征的平均值(或最大值)。这些概要统计特征不仅具有低得多的维度(相比使用所有提取得到的特征),而且还会改善结果(不容易过拟合)。这种聚合的操作就叫作池化(Pooling),有时也称为平均池化或者最大池化(取决于计算池化的方法),如图3.5所示。
(www.xing528.com)
图3.5 池化特征示意图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。