遥感图像检索的精度在很大程度上取决于图像特征是否能够准确、有效地描述图像内容。研究遥感大数据的特征计算方法,从光谱、纹理、结构等低层特征出发,抽取多源特征的本征表示,跨越从局部特征到目标特征的语义鸿沟,进而建立遥感大数据的目标一体化表达模型,是遥感大数据表达的核心问题。传统的图像检索通过提取图像的颜色、纹理、形状等低层视觉特征,或者根据低层视觉特征聚合得到中层视觉特征来描述图像内容,这种依赖于单一或组合的低层或中层人工设计特征的检索,适用于尺度小、场景简单且检索需求不高的应用。然而,随着遥感大数据时代的到来,遥感图像的语义复杂性和检索需求的多样性对遥感图像的内容表达提出了新的挑战。
图1-7 大数据时代信息检索服务模型
自从2006年加拿大多伦多大学教授Hinton等提出通过“逐层初始化”算法来训练深层网络以来,深度学习技术以其良好的特征学习能力引起了学术界的普遍关注,并逐渐成为语音识别、自然语言处理以及图像理解和识别等领域的研究热点。基于神经网络学习图像特征的方法一般分为两类:一是无监督的浅层学习(如稀疏编码和自编码网络),训练时不需要或仅需要少量的带标签数据样本,但是图像特征表达能力有限,属于浅层网络;二是有监督的深层学习(如卷积神经网络),与浅层网络相比,深层网络通常包含几十甚至上百个网络层,可以实现由低到高的逐层特征学习,因此具有更强的特征表达能力。代表性的卷积神经网络包括AlexNet、VGG、GoogLeNet、ResNet、DenseNet等。但是,从头开始训练(training from scratch)一个新的深层卷积神经网络需要大量带标签的数据样本,而在遥感领域这样的带标签样本是稀缺的。(www.xing528.com)
在实际应用中,一般通过迁移学习(transfer learning)解决带标签训练数据样本有限的问题。迁移学习旨在从一个或多个源任务中提取知识,并将知识应用于目标任务。例如,将在大数据集上预先训练的网络模型“迁移”到目标领域解决特定任务。迁移学习已被证明在遥感图像检索研究中可以获得比传统人工特征优越的性能。具体的迁移方式包括预训练和精调(fine-tuning,又称微调)两种,预训练是直接使用在自然图像集(如ImageNet)学习到的网络结构和参数,不需要额外的数据再对网络进行训练,用于目标任务时,只需要用目标数据集替换原网络的输入数据,并根据目标数据集的不同对网络最后分类层的参数进行更改即可;精调则是用有限的带标签训练样本对整个预训练网络进行参数调整,即将预训练网络当前的参数作为训练起点,用目标数据继续对其进行训练或者是冻结预训练网络某几层参数,对其它网络参数进行调整,这种方式能够很大程度上减少对训练数据的依赖,通常能够取得比直接采用预训练网络更为理想的效果。针对一些具体的任务,为了提高特征判别能力,有时将不同的深度特征或者将深度特征和浅层特征综合起来,以更好地表达遥感图像内容。
2014年,Ian J.Goodfellow等人提出一种无监督的深度学习模型——生成对抗网络模型(generative adversarial nets,GAN),在计算机视觉的许多领域产生了巨大的影响力,特别是在图像生成方面有非常卓越的表现。生成对抗网络的基本思想是通过生成模型(generative model)和判别模型(discriminative model)之间的互相博弈学习,生成与真实数据分布一致的数据。基于GAN网络训练不稳定的问题,Alec Radford等人在2016年提出一种改进的对抗生成网络模型——深度卷积对抗生成网络(deep convolutional GAN,DCGAN),通过将卷积神经网络和生成对抗网络相结合,实现从大量未标注数据中学习有用的特征表达,并用于其它监督学习任务。生成对抗网络在遥感领域的应用包括图像超分辨、图像融合、图像或场景分类等。例如,Lin D.等人首次将GAN应用于遥感领域,他们基于DCGAN提出一种多层特征匹配生成对抗网络模型(MARTA GANs),用于从无标注数据中学习遥感图像的表示,在公开的标准遥感数据集分类实验中,获得了优于其它无监督学习方法的性能。
总之,面对海量多源的遥感大数据,如何从中挖掘到更具判别性的图像特征,并通过融合不同层次的特征构建层次化特征模型,是实现遥感图像智能、准确、高效检索的关键。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。