首页 理论教育 水下声图像识别在人工智能与船海工程中的成果

水下声图像识别在人工智能与船海工程中的成果

时间:2026-01-25 理论教育 姚姚 版权反馈
【摘要】:检测阶段使用非线性匹配滤波器识别声呐图像中与水雷特征紧密匹配的雷区。Aridgides等人开发了一种自动、稳定、自适应的杂波抑制、水雷探测和分类处理器,并将其应用于侧扫声呐图像数据中。基于ACF/特征正交化的LLRT水雷分类处理方法提供了与利用专家声呐算子时相同的正确水雷分类的平均概率和虚警率性能。然而,使用匹配滤波器作为检测器并不理想,因为目标在声呐图像中的形状、组成和方向可能变化很大,容易导致漏检。

Dobeck等人开发了一种先进的自动海洋水雷探测和分类系统,该水雷检测与分类(advanced mine detection and classification,AMDAC)算法包括改进的检测密度算法、使用逐步特征选择策略的分类特征提取器、基于k-最近邻吸引子的神经网络(KNN)分类器以及最优鉴别滤波器分类器[176]。检测阶段使用非线性匹配滤波器识别声呐图像中与水雷特征紧密匹配的雷区。对于每个检测到的类雷区域,特征提取器计算大量的候选分类特征集。然后通过一个逐步特征选择过程确定子集特征,该子集特征优化每个分类器的检测概率和分类概率,同时最小化错误报警。

Aridgides等人开发了一种自动、稳定、自适应的杂波抑制、水雷探测和分类处理器,并将其应用于侧扫声呐图像数据中。整个处理过程包括数据预处理、自适应杂波滤波(adaptive clutter filtering,ACF)、二维归一化、检测、特征提取和分类处理块[177]。数据预处理块包含自动增益控制和数据抽取处理。ACF技术设计了一个在最小二乘意义下最优的2D自适应距离——交叉范围线性有脉冲响应滤波器(finite impulse response,FIR)滤波器[1],同时抑制背景杂波,并保持使用训练集数据先验计算的平均峰值目标特征(归一化形状)。使用多参考ACF算法版本可计算多个目标形状,如不同的地雷类

声呐是迄今为止在所有监视手段中每平方米水下覆盖面积成本最低的,这是因为相对于其他传感手段(电磁波、视觉光、温度、磁性),声波在浑浊的港湾水域具有低衰减和长传播距离的特点。在军事方面用于检测和跟踪水下入侵者的主要声呐技术是主动单基地声呐,在其信号处理中采用传统的波束形成原理。这些声呐现在可以从许多不同的制造商那里获得,这些制造商可以推荐用于监视水下入侵者的设备。而其他声呐技术,例如主动多基地或被动声呐,可能具有基于模型的信号。声呐图像中水下目标的检测是一个复杂的问题,很多种因素都会对水下图像检测造成干扰,如操作和环境条件的变化、存在空间变化的杂波以及目标形状、组成和方位的变化等。此外,底部特征如珊瑚礁、沙层和植被可能会遮蔽目标或混淆检测过程。型、多个目标方位角等。检测块包括阈值化、超出聚类和限制其数量,以及二次阈值化过程。在特征提取之后,分类块对数据应用新的变换,该变换使特征正交化,并且使得能够有效地应用最优对数似然比检验(log likelihood ratio test,LLRT)分类规则。两个侧扫声呐数据集能证明整个处理方法的实用性。基于ACF/特征正交化的LLRT水雷分类处理方法提供了与利用专家声呐算子时相同的正确水雷分类的平均概率和虚警率性能。Aridgides等人把自适应杂波滤波器检测器分别应用于频率和带宽变化的三个不同的声呐图像。最终的决策是通过使用对数似然比测试的一组最优特征来完成的,其中融合了各个分类器的决策[178]。Chandran提出使用匹配滤波器来捕获目标结构,然后从傅里叶变换的相位提取高阶谱作为特征分类对象[179]。使用最近邻分类器、最小距离分类器和基于阈值的分类器。三个分类器的输出被融合以产生最终的判决。然而,使用匹配滤波器作为检测器并不理想,因为目标在声呐图像中的形状、组成和方向可能变化很大,容易导致漏检。Nakib等人提出了一个基于希尔伯特变换的方法[180],利用变换后的图像检测具有目标尺寸先验的高光和阴影结构,提取几何特征,并使用分类树分类。

典型相关分析(canonical correlation analysis,CCA)方法被应用于声呐后向散射数据的水下目标检测与分类。CCA方法不仅量化两个数据信道(如具有一定脉冲间隔的两个声呐)之间的线性相关或相干的数量,而且通过提取的典型相关关系来确定两个数据信道的相干模式。这些相关性和相应的规范坐标允许人们量化从底部返回和目标活动出现时的变化。此外,典范相关为目标分类提供了有用的特征,无需执行单独的检测和特征提取。更具体地说,由这些特征表示的相干图案对包含类似水雷物体的脉冲与对非类似水雷物体的脉冲对是不同的,因此可以区分良好的类似水雷与非类似水雷。Wachowski通过测量两个声呐脉冲中相同频带之间的相干性,将这种相干分析方法扩展到频域[181]。与基于时域相干性的特征相比,这些频域特征提供实质上更好的检测和分类结果。此外,基于频域相干性的特征提取方法为从多声呐中产生可能的目标识别提供了一种更为严格的方法。Tucker详细讨论了CCA方法在声呐图像水下目标探测中的应用[182],从声呐图像中感兴趣区域(region of interest,ROI)的连续列中提取典型相关和坐标,从检测到的ROI中提取特征用于目标分类。

所有检测和分类系统面临的问题是,它们仅依赖于从一个感官系统(在此情况下为一个声呐)进行的观测,因此性能仅限于一个视场(field of interest,FOV),这使得弱目标的检测特别具有挑战性,并且限制了检测性能的任何可能的改进。使用多个不同传感器检测是一种有前途的解决方案,这种方法可以更好地捕获目标特性,因为这种方法检测的目标是从不同的角度、掠射角、射程、频率和可能的感测模态观察到的。不管数据是如何在融合中心处理的,这个原则总是正确的。然而,以网络为中心的传感器分析模式(network-centric sensor analysis mode,NSAM)需要仔细考虑局部(传感器级)计算需求、通信网络带宽限制以及传感器在多个不同的自主水下机器人上的更精细的搜索规划。此外,由于初步决策和特征提取通常在每个平台上独立地进行,因此融合中心可能仅能访问部分或不完整的信息,从而导致整体性能的损失。

不同决策之间的协作在充分利用有限的通信和处理资源的同时,减少了在实时NSAM情况下决策中的这种不确定性,但这是以某种更复杂的传感器管理策略为代价的。为了允许在多个传感器平台之间进行协作决策,必须检测和进一步检查由各种传感器系统收集的数据中的信息承载部分,这包括检测、隔离和表示(根据一些相关的属性)多个数据集中的相干信息。由于相干信息数据的复杂程度较高,想要实现检测、隔离和表示,是极具挑战性的问题。因此,需要新的算法如下:协同检测在传感器的视场内发生的威胁;执行特征提取以捕获来自多个传感器平台的共同目标属性;基于来自多个不同平台的检测和定位目标,开发单个综合目标评估画面。

基于这些目标,Derek Tucker研制了一种用于双声呐水下目标检测的双通道高斯—高斯复合探测器[183]。在这个框架中,CCA通道包含与单独背景(或空假设)或目标加背景(或真实假设)相关联的复合向量。这与标准CCA检测器不同,后者使用假设CCA信道总是信号,而另一个信道是观测。考虑这两个通道假设检验的综合性质,该系统目标是将这些措施与它们的单通道对应物联系起来以便于实施。为了将此框架扩展到多个不同的声呐平台,从而大大提高检测性能,还开发了一个分布式检测系统。该系统采用双声呐双通道高斯—高斯复合探测器作为各平台的局部决策器。这种分布式检测系统在监视区域中可能存在多个AUV的情况中特别有用,每个AUV都装备有两个声呐(或任何其他感官)系统。平台上的每个决策者将其决策传送到融合中心,在那里进行最终的决策。因此,这种分布式多声呐平台检测系统只需要最小的通信带宽,因为只有决策和一些局部特征被传输到融合中心。此外,所提出的系统易于实现、通用和模块化,因为它可以容易地在威胁检测和定位中结合具有不同传感器特性的任意数量的传感器平台。Tucker展示了这两个系统在改善由巴拿马市海军水面作战中心分部提供的声呐图像数据集上的总体检测性能方面的有用性。该数据集包括来自高分辨率高频合成孔径声呐和两个宽带合成孔径声呐的声呐图像,这两个合成孔径声呐图像在同一区域上进行配准。这些图像包含无目标、一个目标或多个目标。

水雷类物体经常通过使用声呐图像中物体投射的高亮和阴影来检测,阴影通常是区分水雷类物体与背景的关键特征。在传统的水雷探测方法中,来自目标的镜面反射比来自海底的漫反射更明亮(即更强的反射信号),通常将自适应阈值分配给映射特征。这是非参数检测的最简单形式,并且已经证明在相对无杂波的环境中对于目标检测是有效的。然而,杂乱的背景可能会产生许多假阳性的水雷探测。目前的水雷探测方法已经使用了先进的信号处理技术。例如,Reed等人使用Dempster-Shafer信息对水雷进行分类[184]以减少误报警,Dura等人提出了一种数据自适应算法来消除对先验任务的训练需求[185]。在已有的文献中已经提出了用于水雷检测的特征级融合方法,该方法使用包括似然比检验的贝叶斯框架[186]。Calder等人对传统的贝叶斯检测方法进行了改进,包括利用物体的几何和统计特性[187]。统计建模可以提供可观的斑点滤波,同时保留有用的信息。Bhradwaj和Carin提出了一种图像分类技术[188],采用适合于图像子分量的模板。Markov模型被用于统计地描述相邻图像子分量之间的关系。Quattoni基于隐藏条件随机场开发了先进的图像分类工具[189],该方法采用邻域图结构来捕获图像区域之间的条件依赖关系。Ye等人使用水平集模型将声呐图像分割成阴影区域和高亮区域[190],该方法基于高斯马尔可夫随机场提取特征,有效地去除了声呐图像中的斑点噪声。Maussang等人应用目标检测的自适应数据阈值以及不需要存在用于水雷检测的阴影的统计方法,这对于检测埋地水雷是很有效的[191]

针对自主式水下航行器侧扫声呐图像,Mukherjee提出了一种鲁棒特征提取的符号模式分析方法[192],该方法基于符号动力学和自动机理论的数据驱动算法探测海底环境中的水雷和类似水雷物体。这种实时算法是基于通过粗粒度化的数据空间的符号化来实现,即二维声呐图像的分割。通过构造概率有限状态自动系统,从符号化图像中提取作为特征的随机矩阵形式的统计信息,设计了一种二值分类器,用于将检测到的物体区分为类雷目标和非类雷目标。模式分析算法在探雷阶段产生的声呐图像上得到了验证,这些数据由海军水面作战中心提供。该算法用于有限内存商用货架平台上的实时执行,能够检测海底物体。声呐以恒定的速度沿直线轨道移动,并在海床上方的恒定高度处移动。图5-13给出了发射声呐波束的左半部,没有在图中给出的右半部分与左半是相似的。两侧的传感器传输近似垂直于平台运动方向的窄能量束。原始侧扫图像对应于回波强度随飞行时间的变化。通过假设海底是水平的(即零梯度),从原始图像推断水平范围。图5-14给出了声呐射线传播模型以及海床上存在水雷的典型图像。由于假定为水平海床,来自雷状物体(出现在标记为A到B的范围内)的回波被映射到标记为的范围,类似雷的对象A和B的回波映射到标记为A′和B′的范围。

图5-13 典型的侧扫声呐操作原理[193](https://www.xing528.com)

图5-14 声呐波路径中雷样物体的阴影形成

图5-15中给出了四个具有代表性的图像,每个图像显示了由海底混响和杂波组成的不同水平的背景噪声。选择一组具有代表性的阈值来产生具有可接受的误报警率的高检测概率,其前提是漏检测比误报警花费更多。测试表明,Mukherjee等人提出的算法能够检测出海底杂波浓度较高的地雷,包括埋在航行器伪影下的水雷。

图5-15 不同噪声水平水雷检测

Hyeonwoo Cho等人提出了一种利用高速成像声呐实现水下可疑目标自动检测报警的方法,所提出的方法是基于成像声呐的两个连续声学波束轮廓之间的互相关系。警报信号向操作人员或自动水下航行器警告可疑物体,这些可疑物体可以是目标物体的一部分或全部。使用这个信号作为触发器,然后可以更详细地检查对象以确定它是否是目标。通过室内和现场实验,验证了该方法的可行性。

获得精确的海底环境的三维地图为许多应用提供了基础,例如为考古学绘制沉船图、监测珊瑚礁的健康状况、检测海上石油钻机和管道中的故障、检测和识别,海底潜在威胁的阳离子等。Thomas Guerneve等人利用可安装在小型水下平台上的商用声学系统,获得全天候条件下近距离物体的精细三维重建[193]。水下成像研究一般通过使用窄孔径和宽口径的光束来理解水下场景。基于雕刻方法的研究工作证明了使用声学成像器来获得环境的3D地图的可行性[194],通过恢复足够的信息以实现手动对象识别。这些系统,例如BlueView声呐或Didson声相机,提供近距离高分辨率成像,在现有的水下平台上广泛可用,并且传统上用于执行其他任务,比如避碰、海底地图绘制、目标跟踪等。宽孔径传感器的大空间足迹能够实时成像大量的水下目标物。然而,它们更宽的孔径通过更复杂的成像模型导致模糊,从而降低空间分辨率。如果能够从这样的图像中实现3D重建,对于水下勘察有重要的好处。最重要的是,单个成像传感器可用于地图绘制、导航和3D重建,当前将需要两个或更多个专用传感器,因此减少了AUV上的传感器有效载荷。此外,当航行器导航没有完全控制时,传感器的视场能够比传统的轮廓系统实现更好的覆盖。图5-16a中的图像例证了所获得声呐图像的质量差。Thomas Guerneve等人提出了两种不同的公式来解决这个问题:第一,以经典的盲解卷积的形式,具有空间变化的核,以及随后作为非线性近似(类似于体素刻画),使得其本身易于实现。虽然第二种方法采用约束线性求解器进行求解。第一种方法假定传感器直线运动,第二种方法允许无约束轨迹。对这两种方法进行定量分析,并用通常嵌入水下平台的两种不同的传感器,通过模拟和在水箱中的测量,在受控实验中证明了它们各自的相对优势。实验验证了重建方法对AUV获取的现场数据的适用性,显示出能够恢复如图5-16b、c所示结构的精确3D表示。

图5-16 水下声呐图像

Yoojeong Seo等人探讨了逻辑回归模型辨识杂波与目标之可行性,并验证了由该数学模型所产生之模拟资料所训练的模型应用于实际实验资料的可行性[195]。第一阶段,当杂波信号能量非常强大,以至于难以检测目标时,采用逻辑回归模型来区分强杂波信号和目标信号。如果杂波能量较大,即使对于各种现有的检测方案,也会发生误检测。为此,应用主动声呐接收的声信号的离散傅里叶变换(discrete fourier transform,DFT)幅度谱来训练模型以区分接收信号是否包含目标信号。从接收机工作特性(receiver operating characteristics,ROC)、ROC曲线下面积(area under curve,AUC)和分类表等方面验证了模型的拟合优度。以目标杂波比(target clutter ratio,TCR)为指标,通过检测率评价了该模型的检测性能。此外,实际的实验数据被用来测试所提出的方法。在利用实验数据检验模型时,用基于圆柱体后向散射数学模型生成的模拟数据训练回归模型。由于无法获得包括声速、泥沙类型等有关实验环境的信息,一旦在各种条件下生成模拟数据,就使用70%的实验圆柱数据来选择有效的模拟数据。随机选取实验圆柱体数据,占总实验圆柱体数据的70%,并用岩石测量数据对模型进行了验证。这一过程反复进行了1 000次。结果表明,该方法在实验数据不充分、目标数学模型可用的情况下,是有效的。

针对高频合成孔径声呐(synthetic aperture sonar,SAS)成像中的目标检测问题,David P.Williams提出了一种称为Mondrian检测器的新算法[196]。如果低频带图像可用,则该算法可以通过辅助预筛选器测试无漏洞地利用附加信息。这种灵活的单频段和多频带功能填补了一个重要的能力差距。该算法的总体预测器组件限制了潜在告警的数量,该方法的主模块搜索通过像素强度测试子集的区域。在研究过程中还采用了一种新的特征分类方法。为了便于性能估计,避免要求专门的训练数据,并允许在自主水下航行器上进行延迟的实时海上检测,注意使整个框架保持简单。新算法的前景在六个实际SAS图像数据集上得到证明,这些数据集收集于各种地理位置,共同展现出各种各样的海底特征。

Yu等人研究了一类有理正交小波变换在主动声呐检测中的应用。宽带有源声呐系统被分类为基于小波的非相干子带能量检测,它具有灵活的宽带声呐脉冲设计、低峰值平均功率比(peak to average power ratio,PAPR),以及通过快速有理小波滤波器组实现低计算复杂度的检测器。所设计的宽带脉冲族是基于复有理正交小波(complex rational orthogonal wavelet,CROW)的多基函数的组合。与传统的二进小波(整数尺度因子为2)不同,CROW具有合理的尺度因子和更高的时间尺度平面划分分辨率。这一系列小波在系统设计中具有很大的灵活性。设计实例与最小化PAPR服务的应用要求隐身。声呐检测器是基于CROW分析滤波器组的。利用几何水声信道模型,通过仿真分析了其抗多普勒噪声和多径性能。将基于小波的主动声呐系统的性能与基于线性调频脉冲的系统进行了比较,接收机工作特性曲线表明,所设计的系统能够应对严重的多径、高环境噪声和严重的多普勒频散。该框架为低信噪比和不同移动性条件下的水下应用提供了可能的解决方案。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈