首页 理论教育 基于二进制哈希码的遥感图像检索优化方案

基于二进制哈希码的遥感图像检索优化方案

时间:2023-06-26 理论教育 版权反馈
【摘要】:结果表明,基于DLBHC方法的检索通过添加潜在层学习遥感图像的深层特征表示以及哈希映射关系,有效提高了检索性能。同样的,红色框表示错误检索类别,并在其下注明所属类别,结果表明,DLBHC在解决类内差异时具有良好的语义保持能力。图7-9基于二进制哈希码的遥感图像检索结果

基于二进制哈希码的遥感图像检索优化方案

基于二进制哈希码(deep learning of binary hash codes,DLBHC)的检索方法的基本思想是:一方面在深度卷积神经网络中添加了一个潜在属性层,当数据标签可用时,通过使用隐藏层中表示类标签的潜在概念来学习二进制代码;另一方面提出由粗到细的分层搜索策略对检索的相似的图像进行重排,提高图像检索的准确率。也就是说,DLBHC不仅关注哈希编码过程中原始空间与投影空间之间的相似性保持,同时关注哈希码的排序问题。

基于DLBHC的图像检索整体框架图如图7-8所示,主要由三个模块组成:模块一在大型数据集ImageNet上对卷积神经网络进行有监督的预训练,以学习丰富的中层图像表示;模块二向网络中添加了一个潜在层,并且在目标域数据集上进行精调,同时学习特定域的图像特征表示和哈希映射函数;模块三通过提出的分层深度搜索策略检索与查询相似的排名前k的图像。

图7-8 基于二进制哈希码(DLBHC)的图像检索整体框架图[72]

DLBHC方法提出同时学习特定域的图像表示和哈希映射函数的深度哈希框架。具体流程可以描述为:

(1)学习近似的二进制哈希码。如图7-8所示,假设最终分类层F8的输出结果依赖于潜在层H的h个隐藏属性,生成相似的二进制近似哈希码的图像将具有相同的标签,F7和F8之间的潜在层H是一个全连接层,其神经元激活值受分类层F8的影响更新,其神经元被sigmoid函数激活,激活值近似为{0,1}。

为了实现域自适应,DLBHC通过反向传播在目标域数据集上对网络进行了精调,初始权重被设置为从ImageNet数据集训练的权重,潜在层H和最终的分类层F8的权重进行随机初始化,潜在层H的初始随机权值类似于LSH,使用随机投影来构造哈希比特,然后将其修改为更适合于深度监督学习的数据。研究表明,在不对深度卷积神经网络模型进行大幅度修改的情况下,DLBHC能够实现同时学习特定域的视觉特征表示和哈希近似函数。

(2)分层深度搜索。Zeiler和Fergus(2014)对深度卷积神经网络进行了分析,认为浅层网络学习图像的局部视觉描述,而深层网络捕获图像的高级语义信息。DLBHC采用一种粗到细的搜索策略来快速、准确地进行图像检索,首先通过潜在层检索出一组具有相似的高级语义特征的图像候选池,即候选池中的图像在隐藏层具有相似的二进制激活值;然后为了进一步过滤出外观相似的图像,基于F7的中层图像特征对候选池进行相似性重新排序,实现精确检索。具体过程如下:

给定图像I,设潜在层的输出用Out(H)表示,然后对Out(H)进行阈值化处理得到二进制码。对于潜在层,每个比特位j=1,…,h(其中h是潜在层中的节点数),输出的二进制代码为:(www.xing528.com)

表7-3给出基于DLBHC方法在UCMD、AID数据集上的检索性能定量评价结果,并与传统的采用无监督浅层特征(512维GIST特征)的方法(如LSH、KSH)以及使用深层语义特征的方法(如CNNH)进行了对比。返回图像的数量分别设为200、400、600,采用mAP作为评价指标。

结果表明,基于DLBHC方法的检索通过添加潜在层学习遥感图像的深层特征表示以及哈希映射关系,有效提高了检索性能。

表7-3 基于DLBHC的遥感图像检索性能分析表(mAP:%)

图7-9给出一组基于二进制哈希码(DLBHC)的遥感图像检索结果。以AID为数据集,选择中心(center)作为查询类别。同样的,红色框表示错误检索类别,并在其下注明所属类别,结果表明,DLBHC在解决类内差异时具有良好的语义保持能力。

图7-9 基于二进制哈希码(DLBHC)的遥感图像检索结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈