首页 理论教育 数字图像组成-深度学习与深度合成

数字图像组成-深度学习与深度合成

时间:2023-11-18 理论教育 版权反馈
【摘要】:位图图像的最基本组成单元为像素,图像可以看作很多像素的集合。利用RGB色彩空间表示的图像又称为三通道彩色图,使用红色、绿色和蓝色加色混合产生不同的合成色,RGB分别代表英文单词Red、Green和Blue。用16进制数表示时,000000代表黑色,FFFFFF代表白色。图3-1灰度图像数值与色彩对应关系基于以上认识,不管是RGB图像还是灰度图像都可以使用像素点矩阵来表示,差异就是不同空间表示像素的方法不同。

数字图像组成-深度学习与深度合成

图像是人类通过眼睛对外界的一种视觉感受,它可以存在于人们的脑海之中,也可以通过某种形式(如照片或数码照片)保存下来,在此主要讨论的是计算机对图像(一般称之为数字图像)的处理,下面了解一下计算机怎么看待图像。

计算机中图像分为矢量图(vector)或位图(bitmap)两种。矢量图根据几何特性来绘制图形,尽管具有占用内存空间较小、清晰度分辨率无关等优点,但其主要依靠软件使用线段和曲线描述图像,图形色彩不丰富,无法表现逼真的实物,矢量图常用于表示标识、图标等简单直接的图像。而位图图像也称点阵图像,使用一格一格的像素点来描述图像,可以表现出色彩丰富的图像,如逼真表现自然界各类实物,因此,包括手机数码相机等拍摄的照片都以位图的形式进行存放,其存储的文件类型包括jpg、png、bmp、tiff等。在深度学习图像处理中基本都以位图作为处理对象。

位图图像的最基本组成单元为像素,图像可以看作很多像素的集合。像素一般代表图片中某个位置的颜色,很多个像素点按照行列的形式排列起来,就可以组成一个二维平面点阵,这就是图像。以我们常见的电脑桌面背景为例,如果是1920px×1080px的大小,那就代表1920列、1080行,共1920×1080(273600)个像素。

图像表达常会用色彩空间的概念,如常见RGB色彩空间和灰度色彩空间这两种,也称为RGB图像和灰度图像。RGB色彩空间包含了大量人眼可见的色彩,在日常生活中也经常可以见到其应用。利用RGB色彩空间表示的图像又称为三通道彩色图,使用红色、绿色和蓝色加色混合产生不同的合成色,RGB分别代表英文单词Red、Green和Blue。这里的三通道代表通道数,可简单理解为表示单个像素点所需要三个整数数字来代表,如(0,100,200),分别代表红色部分的颜色值为0、绿色部分为100、蓝色部分为200。注意三种色彩对应的取值范围都是0~255,数值越大表示颜色越深,越小则越浅。所以RGB像素不同的组合总数为:256×256×256=16777216,其中(0,0,0)表示黑色,(255,255,255)表示白色。用16进制数表示时,000000代表黑色,FFFFFF代表白色。

灰度色彩空间相对而言更加简单,因为只有一个色彩通道,也可以叫作单通道图像。灰度图像中的每一个像素点通常用0~255之间的一个整数数字表示,0表示黑色,255表示白色,整数数字从0变到255表示颜色由黑变白的一个过程。像素点颜色越黑则越接近0,越白则越接近255(图3-1)。(www.xing528.com)

图3-1 灰度图像数值与色彩对应关系

基于以上认识,不管是RGB图像还是灰度图像都可以使用像素点矩阵来表示,差异就是不同空间表示像素的方法不同。灰度图像可用一维矩阵表示,里面填满了0~255间的整数;而彩色图像则是三维矩阵表示,维度分别代表高、宽和通道数。在计算机对图像进行读取时,单个图像文件以三维矩阵的形式存储于数组(array)中,多个图像文件可以将对应多个数组存放于列表(list)数据类型中,方便图像文件的各种后续处理(图3-2)。

图3-2 灰度图像表示

在OpenCV中,使用的是与大多数RGB通道不同的BGR通道,即第一个元素是蓝色(Blue)、第二个颜色是绿色(Green)、第三个颜色是红色(Red)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈