模式识别是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。70年代,几本很有影响的模式识别教材的相继出版,如Fukunaga的Introduction to Statistical Pattern Recognition和Duda &Hart 的Pattern Classification and Scene Analysis,以及1972年第一届国际模式识别大会的召开,标志着模式识别领域的形成。80年代,反向传播(Back-propagation,BP)算法的重新发现和成功应用推动了人工神经网络研究和应用的热潮。90年代前期,采用结合多个分类器的方法开始在模式识别界盛行,后来受到模式识别界和机器学习界的共同重视。
进入21世纪,模式识别研究的趋势具有以下四个特点:一是贝叶斯学习理论越来越多地用来解决具体的模式识别和模型选择问题,产生了优异的分类性能;二是传统的问题,如概率密度估计、特征选择和聚类等不断受到新的关注,新的方法或改进/混合的方法不断提出;三是模式识别领域和机器学习领域的相互渗透越来越明显,如特征提取和选择、分类、聚类及半监督学习等问题成为二者共同关注的热点;四是由于理论、方法和性能的进步,模式识别系统开始大规模地用于现实生活,如车牌识别、手写字符识别和生物特征识别等。
模式识别过程包括以下几个步骤:信号预处理、模式分割、特征提取、模式分类和上下文后处理。其中,信号预处理是通过消除信号、图像、视频中的噪声来改善模式和背景间的可分离性;模式分割是将对象模式从背景中分离或将多个模式分开的过程;特征提取是从模式中提取表示该模式结构或性质的特征,并用一个数据结构(通常为一个多维特征矢量)来表示;模式分类就是在特征表示基础上,分类器将模式判别为属于某个类别或赋予其属于某些类别的概率;上下文后处理则是利用对象模式与周围模式的相关性验证模式类别的过程。根据模式识别当前发展的现状和未来的发展趋势,结合其在国土安全信息处理中的应用需求,重点关注模式识别在目标识别中的应用研究,包括对固定设施目标、停靠在设施目标中的目标、有一定规则的团块目标、阵列目标、运动目标的识别等。
5.6.1 基于模糊聚类理论的模式识别
随着计算机技术的迅速发展,模式识别由于其科学应用价值,在人工智能及各种信息处理领域中受到越来越多的重视。实质上,模式识别的主要任务是从数据中发现知识,它要求能从提供的数据中挖掘数据之间的内在联系,寻找系统的内在规律,利用优化计算方法,进行自组织分类或按导师要求分类。因此,分类是模式识别的基础,一旦分类完成,机器就可以根据分类结果进行自动识别。模糊聚类分析作为分类的有力工具,在模式识别的研究领域中获得广泛应用,并且具有十分重要的理论意义和实用价值。
聚类是把具有相似性的事物区分开并加以分类。聚类分析就是用数学方法,按一定要求和规律对事物进行分类的方法,它不仅是多元统计分析的方法之一,而且也是统计模式识别中的非监督模式识别的一个重要分支。聚类分析也被称为无监督分类,其目的在于挖掘数据集合的内部结构特征,并根据特定的相似性度量将数据集划分成一定数目的子集,使得同一子集内部的样本具有较大的相似性,而不同子集间的样本具有较小相似性。同时要求分类准确,分类过程及结果可重复,不依赖于分析者的主观判断。确定数据集中样本相似性的常用方法是欧氏距离,目前已提出了许多不同的聚类方法来解决聚类问题。根据样本与各类别的隶属关系,聚类方法常分为硬聚类方法和模糊聚类方法。硬聚类割断了样本与样本之间的联系,无法表达样本在类属方面的中介性,使所得的聚类结果偏差较大,并且易陷入局部最优解。模糊聚类方法使得各个样本可以用不同的隶属度划分到各个类别,即将样本对各个类的隶属度扩展到区间[0,1]。模糊聚类顾及了样本与样本之间的联系,认为每个样本与各个聚类中心都有一个隶属关系。模糊聚类能有效地对类与类间有交叠的数据集进行聚类,所得的聚类结果明显地优于硬聚类,也能更客观、更准确地反映现实世界的实际情况。模糊聚类一般要求每个样本对各个类的隶属度之和为1,这一要求是对划分情况的概率约束,与硬聚类算法相比,模糊聚类算法的收敛速度要慢得多。
聚类算法的性能与数据集密切相关,没有万能的聚类算法,这也是新的聚类算法层出不穷的原因。聚类分析的最主要的缺陷是,不管所给数据集的结构如何,它总能将数据集进行分类。因此,在应用聚类算法之前,需要研究以下三个方面:聚类趋势问题研究的是基于模式集是否有聚类结构;聚类分析问题研究的是如果存在聚类结构,如何确定聚类算法;聚类有效性问题研究的是一旦模式集被分类,如何判断聚类数的合理性。为了求得最佳的分类数,人们主要从以下途径进行研究:基于数据集的模糊划分的聚类有效性函数和基于数据集的几何划分的聚类有效性函数等。有效性问题是聚类分析的瓶颈,该问题的解决将会对聚类分析的成功应用产生十分深远的影响。
5.6.2 基于贝叶斯决策理论的模式识别
贝叶斯决策理论方法是统计模式识别中的一个基本方法,这种方法在对数据进行概率分析的基础上生成分类器(决策规则),再应用生成的分类器对新数据依据概率方法进行分类。在运用贝叶斯理论的时候必须满足如下的基本条件:各类别总体的概率分布是已知的;被决策的分类数是一定的。
有很多种标准用于衡量分类器设计的优劣,对于用贝叶斯决策而言,有基于最小错误率的贝叶斯决策,基于最小风险的贝叶斯决策,在限定一类错误率条件下使另一类错误率为最小的两类别决策、最小最大决策、序贯分类方法等。
5.6.3 目标知识库建立
目标识别的实质是把外界客体的明暗、颜色、位置、深度和长宽等特性映射到识别系统空间中,然后对这些特性在识别系统空间中所形成的像的“形状”进行分析,实现对外界客体的识别。
准确地表述目标的特征是后续识别的关键。为了建立准确、高效的目标表述模型,需要认真考虑特征的选择、组织和安排问题。特征选择涉及特征的质量和特征的数目,特征的组织和安排则包含如何使特征形成合适的目标模型结构。
5.6.4 目标特征提取
目标特征提取是指原始信号经过变换得到特征量的过程。传统的线性变换方法主要有主成分分析和线性鉴别分析,后者又叫费舍尔鉴别分析。线性鉴别分析的子空间学习是有监督的,目的是使子空间中类间离散度和类内离散度的行列式之比达到最大。线性鉴别分析假设各类样本服从高斯分布且不同类的协方差矩阵相同,而且所有样本在总体上服从高斯分布。另外,线性鉴别分析提取的特征个数受到类别数的限制,而当训练样本数相对特征维数较小时,会带来很多计算上的问题。经过多年的发展,基于图像的目标特征提取算法日渐成熟,但对于遥感图像普遍单幅数据较大时,计算速度慢,特征提取时间过长,因此有人将群集智能理论引入目标特征提取中,以提高大数据量下目标特征提取的速度问题。针对团块目标或阵列式目标特征的提取有一定的特殊性,需要单独研究。
(1)群集智能理论在目标特征提取中的应用:群集智能理论的基本原理是以生物社会系统为依托,也就是由简单个体组成的群落与环境以及个体之间的互动行为。这种生物社会性的模拟系统利用局部信息产生难以估量的群体行为。ACO是一种模拟昆虫王国中蚂蚁群体智能行为的仿生优化算法,它具有较强的鲁棒性、优良的分布式计算机制、易于与其他方法相结合等优点。在特征选择标准基础上,利用ACO群集智能进行寻优,从原始特征中选出使各类样本尽可能远地互相分开的特征。通过该方法可以快速地提取图像中固定设施目标的一些有效特征,例如机场的跑道长度、机场上停靠的飞机、港口中停靠的船舶的尺寸等。
(2)团块目标特征提取:基于遥感图像检测和识别团块目标具有较大的难度,这是由遥感图像的特点和团块目标的特性共同决定的。从遥感图像的特点来分析:基于遥感图像的侦察通常是对大面积区域进行监视,所获取的遥感图像数据量大,目标的相对面积小,背景较为复杂;图像获取时的季节气候、大气状况、光照条件、摄像机视角以及比例尺等因素也会发生难以预知的变化,导致图像中目标的大小、姿态、光谱、形状、纹理、方向随之发生较大变化,目标特性极不稳定。从团块目标的特性来分析:首先,团块目标涵盖多种目标类型,不同类型的团块目标一般具有不同的图像特征,因此采用单一的图像特征难以有效检测各类团块目标;其次,虽然团块目标与其所处背景之间存在着亮度、颜色、纹理、规则度等多方面的差别,但是这种差别具有局部化的特点和很大的不确定性,由于团块目标出现的环境比较复杂,目标和背景的差异在不同环境中往往具有不同的体现;第三,团块目标的类型和尺度也会发生难以预测的变化。这些因素都给团块目标的有效检测造成困难,因此,在遥感图像中有效检测和识别各类团块目标是一个比较困难的问题。有人提出了基于视觉注意模型的团块目标检测方法,用于解决团块目标的特征提取问题,解决油库、车辆等呈一定规则的目标的识别。
(3)阵列目标特征提取:阵列目标是一类具有规则空间分布关系的群目标。但是,阵列目标的检测和识别问题并不完全等同于团块目标的检测和识别问题。遥感图像中除了包含阵列目标之外,通常还包含大量干扰模式,例如建筑物、道路等。因此,根据视觉显著性检测到的团块目标并不都是阵列目标中的子目标,存在一定数量的虚假目标是不可避免的。但利用阵列目标空间分布关系特征的显著性,可以比较好地解决集结或者编队行进的车辆、降落在机场跑道上的飞机、舰船编队等阵列目标特征提取的问题。
5.6.5 多种分类器相结合的模式分类
模式分类是模式识别研究的核心内容。迄今为止提出了大量的分类方法,主要有三种类型:基于相似度(或距离度量)的分类器、基于概率密度的分类器和基于决策边界的分类器。第一种分类器的性能取决于相似度或距离度量的设计,同时也取决于模板的学习。模板学习有多种方法,如聚类、学习矢量量化、经验风险最小化等。学习矢量量化和经验风险最小化可以看作是决策边界调整的学习方法,而聚类的作用类似概率密度估计。因此,可以把分类器分为以下三类:生成模型(包括概率密度模型)、判别模型(决策边界学习模型)和混合生成判别模型。
判别学习的模式识别方法包括人工神经网络、学习矢量量化、支持向量机、推进方法等。其共同特点是在学习过程中最优化一个目标函数(准则),该函数表示训练样本集上的分类错误率、错误率的上界或与分类错误率相关的损失。
混合生成判别学习的模式识别方法结合了生成模型和判别模型的优点:生成模型表示了类别的概率分布或内部结构,在少量样本上学习可得到较高的泛化性能,对噪声或异常模式具有抗拒,比判别模型在概率分布不容易用参数模型表示时和训练样本较多时其泛化性能更优异,而且判别学习得到的模型一般较小(参数较少)。
经过对目标的原始处理、特征提取,结合目标知识库中已知的目标知识,采用合理的分类器,就可以对目标做出最终的识别确认。(www.xing528.com)
5.6.6 生物特征识别
图5.30 生物特征识别
生物特征识别技术(图5.30)是在生理或行为特征的基础上认识生物个体的自动化方法。生物特征识别技术已成为一系列广泛的高度安全的身份证明和个人身份验证解决方案的基础。应用生物特征识别技术,需考虑以下几个特点:
(1)普遍性:每个人都应该有特点。特殊对象,如哑巴或无指纹的人将需要区别对待。
(2)唯一性:通常没有两个人具有相同的特点,但同卵双胞胎是个特例。
(3)持久性:特性应不随时间发生变化。但随着年龄的增长,人脸特征可能会发生变化。
(4)性能:在各种复杂的环境下,必须能提供准确的结果。
(5)可接受性:大众必须接受样品采集程序。非侵入式的方法更容易被人们所接受。
(6)规避:该技术应该是难以欺骗的。
目前,生物特征识别技术已被广泛应用于国土安全领域。在旅行证件、签证等领域发挥重要作用的个人身份识别和验证,能防止身份信息被盗,通过生物特征认证,可有效提高机场、航空运输安全。现在,生物特征识别技术的应用已远远超出国土安全的范畴,企业范围内的网络安全基础设施、电子银行和电子商务等金融安全、卫生和社会服务等领域,均已广泛应用生物特征识别技术。
生物特征识别技术将生物特征用于验证身份,而传统方式如智能卡、磁条卡、照片ID卡、物理按键等等,可能会丢失、被盗、复制或遗忘。此外,今天快节奏的电子世界意味着要求人们记住数量众多的密码和个人识别码(PIN),如计算机账户、银行自动柜员机、电子邮件账户、无线电话、网站等等,而生物特征识别具有速度快,易于使用,精确、可靠和便捷等优点。
单独使用生物特征识别技术或与其他技术,如智能卡、加密密钥和数字签名集成使用,几乎能涉及所有方面的经济活动和日常生活。与传统的身份验证方法相比,如利用密码或PIN码等,采用生物特征识别技术的个人认证更为便捷、准确,正成为社会大众可接受的、便捷的身份认证方式。
基于生物特征识别技术的身份验证要求比对新采集的生物特征样本(如登录期间捕获的指纹)与注册或登记的生物特征样本(生物特征模板)。在注册过程中,系统将捕获各对象的生物特征,存储于计算机系统中。在识别过程中,系统首先搜索整个数据库,从中找到具有完全特征匹配的已注册身份,如图5.31所示。
图5.31 特征匹配
生物特征识别首先需要一个“完美”的生物特征,适合所有的个体。所有的生物特征识别系统都有自己的优势和劣势,但也有一些共同的特点。生物特征必须存在可明显区分的性状。如近一个世纪以来执法部门所使用的指纹特征,有大量的科学数据证明“没有两个指纹是一样的”。脸或虹膜识别技术也已得到广泛使用,一些新的生物特征识别方法可能是准确的,但尚需得到更多的研究,以建立自己的独特性。
生物特征识别的另一个重要方面是系统是如何“用户友好”的。这个过程应该是快速和容易的,如由摄像机拍摄照片,对着麦克风说话,或者触摸一个指纹扫描仪。
(1)指纹:每个人的指纹均具有唯一性。几十年来,执法机构通过匹配指纹中的特征点,对个人(包括同卵双胞胎)身份进行验证。作为应用最广的生物特征识别技术之一,指纹识别设备广泛应用于台式机和笔记本电脑访问控制。有了这些设备,用户不再需要输入密码,而只要一个触摸便可提供即时访问。同样,通过指纹申请社会福利服务,可以确保受助人无法以假名字骗取福利。
(2)人脸识别:面部图像的识别可以应用于许多不同的情况。例如,使用普通相机拍摄的可见光谱面部图像,或使用红外线相机拍摄的面部热发射图像。典型的基于可见光图像的人脸识别系统均对脸部中心部分进行特征脸建模,通过光谱光学相机,获取可见光人脸图像,然后获取特征脸(去除面部表情或头发)。常用的特征脸提取方法主要有主成分分析法、局部特征分析、神经网络、弹性图理论、多分辨率分析等。目前,可见光人脸识别系统所面临的主要挑战包括降低光照变化的影响和检测口罩或照片,实时头部检测并自动定位人脸。面部识别技术的主要优点是具有非侵入式特点,能被大多数用户所接受。
(3)声纹辨识:声纹辨识的历史可以追溯到大约40年前,其原理是利用不同个体之间的声学特性进行身份鉴别。这些声波模型既反映人体的解剖特征(例如,咽部和口部的大小和形状),又反映人的学习行为模式(例如,语音间距、说话风格)。根据这些特征,便可建立具有唯一性的个人语音模板(或称为“声纹”)。目前常用的各种处理和存储声纹的技术包括隐马尔可夫模型、模式匹配算法、神经网络、矩阵表示和决策树等。有些系统还使用了“反扬声器”技术,如队列模型和世界模型。
(4)虹膜识别:该识别方法使用的是眼睛中的虹膜部分。个人虹膜图案被认为是独一无二的,虹膜识别系统通过视频图像采集系统获得虹膜模式进行识别。目前,虹膜识别系统价格大幅下降,虹膜扫描装置已广泛应用于个人认证领域。即使在眼镜和隐形眼镜存在的情况下,该技术在验证和鉴别模式下均能有效应用。该技术具有非侵入式特点,并不需要与扫描仪进行物理接触,已被证明适用于来自不同民族和部族的个人。
(5)手和手指几何识别:经过20多年的应用,根据手或手指进行个人身份验证的方法被确认为是一种行之有效的方法。系统可以测量任一手或手指的物理特性,包括手的长度、宽度、厚度和表面积。
(6)签名验证:该技术采用动态分析验证个人签名,可通过测量个人签名的尺寸、压力、角度等特征,对个人身份进行验证。该技术在类似于电子商务等一些可接受签名认证的领域内得到了广泛应用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。