首页 理论教育 基于深度监督哈希的遥感图像检索优化方案

基于深度监督哈希的遥感图像检索优化方案

时间:2023-06-26 理论教育 版权反馈
【摘要】:图7-6基于深度监督哈希的图像检索整体框架图[39]具体算法流程描述如下:特征提取。第一项惩罚相似的图像映射成不同的二进制哈希码,第二项惩罚不相似的图像映射成相近的哈希码。红色框表示错误检索类别其下标出所属类别。结果表明深度监督哈希在解决类内差异方面具有良好的语义保持能力。图7-7基于深度监督哈希的遥感图像检索结果

基于深度监督哈希的遥感图像检索优化方案

深度监督哈希(deep supervised hashing,DSH)采用成对图像(相似/不相似)作为训练输入,为了学习到数据集图像紧凑、相似性保留的二进制哈希码表示,精心设计了一个损失函数,保证在汉明空间中相似的(无论是视觉相似还是语义相似)图像被编码为相近的二进制代码,最大限度地提高输出空间的可区分性。同时,对哈希网络的实值输出进行正则化,以此来接近所需的离散值(1/-1)。基于DSH的图像检索整体框架图如图7-6所示。

图7-6 基于深度监督哈希(DSH)的图像检索整体框架图[39]

具体算法流程描述如下:

(1)特征提取网络结构由3个卷积池化层和2个全连接层组成。3个卷积层分别有32、32和64个过滤器,过滤器大小5×5,步幅为1。池化层大小为3×3,步幅为2。第一个全连接层包含500个节点,第二个全连接层(输出层)包含K(代码长度)个节点。

(2)损失函数。将RGB空间表示为Ω,哈希函数的目标是学习从Ω到ᶄ位二进制代码的映射关系F,即F:Ω→{+1,-1}k,为了实现相似图像的编码应尽可能接近,而不同图像的编码远离的目标,语义保持哈希函数设计思路为:对于Ω空间中图像对I1,I2及相应的二进制网络输出b1,b2∈{+1,1}k,定义y=0表示两者相似,否则y=1。损失函数的定义如下:

式中,Dh(·,·)表示两个二进制向量之间的汉明距离,m(>0)是一个阈值参数。第一项惩罚相似的图像映射成不同的二进制哈希码,第二项惩罚不相似的图像映射成相近的哈希码。假设从训练图像集中随机选取N个训练对{(Ii,1,Ii,2,yi)|i=1,…,N},设计的目标是最小化整体损失函数:

(3)量化。由于式(7.14)所示的优化目标中二值码的存在引入了不连续项,使得使用反向传播算法来训练网络变得不可行。常用的解决方案是利用sigmoid或者tanh函数来近似阈值化过程。然而,使用这样的非线性函数将不可避免地减慢甚至限制网络的收敛。为了克服这种限制,DSH对网络的实值输出施加一个正则项以近似得到所需的离散输出值(+1/-1),其定义如下式所示:(www.xing528.com)

式中,下标r表示松弛的损失函数,1表示全1向量,α代表正则项的加权参数。使用L2-范数来衡量网络输出之间的距离,因为低阶范数产生的子梯度会平等对待具有不同距离的图像对,不会利用图像对之间不同距离量级的信息。而正则项选择L1范数可大大减少计算量,有利地加速训练过程。通过将式(7.15)代入式(7.14),损失函数重写为:

表7-2给出深度监督哈希(DSH)方法在UCMD和AID数据集上的检索性能评价结果,并与传统无监督的、使用浅层特征(512-维GIST特征)的LSH、KSH方法以及使用深层语义特征的深度哈希方法CNNH进行了对比。实验中通过交叉验证将α设置为0.01,m=2k(k代表二进制码长)。选择mAP作为评价指标为了充分利用存储空间,采用基于小批次的在线方式生成图像对,在每次迭代中图像对从整个训练集随机挑选得到,保证了被抽取样本的等可能性。结果表明,相较于传统的哈希方法和CNNH,DSH通过端到端的学习较好地保证了输入图像对之间的哈希码相似度的保留。

表7-2 深度监督哈希方法(DSH)性能定量分析(mAP:%)

图7-7给出一组基于深度监督哈希(DSH)方法的遥感图像检索结果。以AID数据集为例,选择农田(farmland)作为查询类别。红色框表示错误检索类别其下标出所属类别。结果表明深度监督哈希在解决类内差异方面具有良好的语义保持能力。

图7-7 基于深度监督哈希(DSH)的遥感图像检索结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈