首页 理论教育 基于深度哈希的遥感图像智能检索优化策略

基于深度哈希的遥感图像智能检索优化策略

时间:2026-01-23 理论教育 筱悦 版权反馈
【摘要】:现有的大规模图像检索通常是通过使用哈希方法来实现的。但是最早提出的基于深度学习的哈希算法,如语义哈希,仍然采用人工设计特征作为网络输入,并没有充分利用深度神经网络强大的特征学习能力,影响了检索准确率的提升。除了哈希函数的学习,另外一些研究则侧重于基于深度学习的哈希码排序。深度学习哈希为遥感大数据高效率、高精度和低存储消耗的检索提供了有效的解决方案。

随着数据规模的增加和应用需求的提高,大多数计算机视觉任务在表示图像内容时,采用的特征向量维数越来越高,而遥感图像通常是包含了丰富而复杂内容的大尺度场景,特征向量的维度往往高达成千上万甚至更高。显然,如果仍然采用过去基于完全枚举法的线性搜索方式,在查询图像与目标图像的特征向量之间进行线性相似性度量,非常耗时,且空间资源消耗很大,无法满足实际应用需求。如何在图像数据量大、特征维度高的情况下,提高检索算法效率并保证语义相似性,是遥感大数据检索要解决的难题。

近似最近邻搜索(approximate nearest neighbor,ANN)正是为了解决高维特征向量带来的高额计算代价以及相应的高存储空间成本问题而提出来的,已经在信息检索、计算机视觉、数据挖掘等领域得到了越来越广泛的研究和应用,例如以图搜图、电影推荐、视频检索等。其中,最经典的基于树结构的近似最近邻搜索,采用空间索引的思想,将数据空间中相互靠近的点视为在特征上具有相似性,根据数据划分或者空间划分的方式建立索引,在基于内容的图像检索研究早期有较广泛的应用。但是,尽管基于树结构的索引在处理维数较低的情况时,能大大降低搜索的计算复杂度,在处理高维数据时却存在“维数灾难”(curse of dimensionality),而且基于树结构的索引所耗费的内存资源也成为影响系统性能的瓶颈,这些不足制约了其在大规模图像检索中的发展。

近年来流行的基于哈希的近似最近邻搜索,通过将高维向量映射为紧凑的哈希码,然后对比哈希码的汉明距离实现相似性查询,既省时又省空间,能够有效克服传统方法处理高维数据时的“维数灾难”,在计算机视觉和模式识别等领域得到了普遍的关注。现有的大规模图像检索通常是通过使用哈希方法来实现的。目前已经提出的众多哈希方法中,根据是否依赖数据,可以将哈希方法分为数据独立的哈希和数据依赖的哈希,数据依赖的哈希方法又称为哈希学习方法(learning to Hash),代表了目前哈希研究的主流。哈希学习过程可以分为哈希编码和哈希排序,哈希编码的关键是保持原始空间与投影空间之间的语义相似性,因此设计一个好的哈希函数,是影响哈希学习性能的关键因素。(https://www.xing528.com)

随着深度学习的兴起和蓬勃,研究人员将深度学习引入哈希学习领域,深度哈希成为哈希学习的重要研究方向。但是最早提出的基于深度学习的哈希算法,如语义哈希,仍然采用人工设计特征作为网络输入,并没有充分利用深度神经网络强大的特征学习能力,影响了检索准确率的提升。2014年,Rongkai Xia等人提出的卷积神经网络哈希采用卷积神经网络学习特征,取得了比人工设计特征更优的性能。此后,人们在设计端到端模式的同时也对学习特征和哈希函数方面开展了更为深入的研究,特别是利用成对或者三元组的语义相似性为约束训练深度神经网络的深度监督哈希。除了哈希函数的学习,另外一些研究则侧重于基于深度学习的哈希码排序。

深度学习哈希为遥感大数据高效率、高精度和低存储消耗的检索提供了有效的解决方案。近几年,研究人员从不同的角度提出了一些基于哈希学习的遥感图像检索方法,从基于人工设计特征的核哈希到深度哈希网络、从单一数据源的深度哈希到跨源数据的深度哈希、从二进制哈希到基于量化的深度哈希等。尽管已经取得了一些研究成果,但是仍有很多难题有待解决,比如目前所提方法的验证所选用的遥感数据集规模有限(多选用UCMD数据集和AID数据集),缺乏在更大规模数据集上的性能分析;数据源远不够丰富,还没有提出跨多种数据源如SAR、LiDAR、众源(crowd source)等的深度哈希方法,分布式深度哈希在遥感领域的应用研究还很欠缺,等等,而这些研究对于推进遥感大数据检索走向实用化至关重要。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈