如图1-9所示,一个完整的数字图像识别系统通常包括四个组成部分:①规范:估计信息模型,压制噪声,即图像预处理;②标记和分组:判定每个像素属于哪一个空间对象或把属于同一对象的像素分组,即图像分割;③抽取:为每组像素计算特征,即图像特征提取;④匹配:解释图像对象,即判断匹配。
图1-9 图像识别系统框图
图像分割将图像划分为多个有意义的区域,然后对每个区域的子图像进行特征提取,最后根据提取的图像特征,利用分类器对图像中的目标进行相应的分类。实际上,图像识别和图像分割并不存在严格的界限。从某种意义上讲,图像分割的过程就是图像识别的过程。图像分割着重于对象和背景的关系,研究的是对象在特定背景下所表现出来的整体属性。而图像识别则着重于对象本身的属性。
但是,并非所有的数字图像识别问题都是按照上述步骤进行的,根据具体图像的特征,有时可采用简单的方法实现对目标对象的识别。例如,图1-10a所示的图像是著名的华盛顿纪念碑,怎样自动检测出纪念碑在水平方向上的位置呢?仔细观察不难发现,纪念碑区域内像素的灰度值相差不大,而且与背景区域相差很大,因此可通过选取合适的阈值做削波处理,将该图像二值化,这里选175~220(灰度值),结果如图1-10b所示。由于纪念碑所在的那几列中,白色像素比其他列多很多,如果把该图向垂直方向作投影,如图1-10c所示,其中黑色线条的高度代表了该列上白色像素的个数。图中间的高峰部分就是我们要找的水平方向上纪念碑所在的位置,这就是投影法。为了得到更好的效果,投影法经常和阈值化一起使用。由于噪声点对投影有一定的影响,所以处理前最好先对原始图像进行平滑,去除噪声。(www.xing528.com)
图1-10 投影法图像识别实例
a)华盛顿纪念碑图像 b)将图a)二值化的结果 c)将图b)做垂直投影
如果可以得到原始图像中除目标之外的背景图像,那么就可将原始图像和背景图像相减,得到的差作为结果图像,实现对图像中感兴趣目标的识别,即所谓的差影法。差影法就是图像的相减运算,又称为减影技术,是把同一景物在不同时间拍摄的图像或者同一景物在不同波段的图像相减,利用差影图像提供的图像之间的差异信息以达到动态监测、运动目标检测和识别等目的。例如,图1-11a是前景图(猫)加背景图(星球),图1-11b是背景图,图1-11b减去图1-11a的结果如图1-11c所示,这样就得到了前景。再如,在银行金库的监控系统中,摄像头每隔一小段时间,拍摄一帧图像,与上一帧图像做差影。如果差别超过了预先设置的阈值,说明金库中有人,这时就应拉响警报。此外数字电影特技中的“蓝幕”技术也包含了差影法的原理。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。