首页 理论教育 多媒体图像处理技术:多媒体计算机技术揭秘

多媒体图像处理技术:多媒体计算机技术揭秘

时间:2023-10-20 理论教育 版权反馈
【摘要】:在多媒体技术的应用中,图像处理是一个重要的组成部分,特别是运动图像的处理是多媒体技术需要进一步解决的关键问题。本章将从几个方面介绍多媒体环境下的图像处理问题,使读者对其有一个基本的认识。§4.1.1 图像的基本概念在学习图像处理之前,首先要对图像处理中出现的一些概念和名词有所了解,下面介绍一些与图像处理有关的名词和概念。确定扫描图片的目标图像大小时,要考虑屏幕分辨率。

多媒体图像处理技术:多媒体计算机技术揭秘

图像是一种人类视觉器官所感受到的形象化的信息,它的最大特点就是直观可见。图像处理是指将客观世界中实际存在的物体映射成数字化图像,也有采用特殊方法和手段(如手工绘制)取得数宇化图像,然后在计算机上用数学的方法对数宇化图像进行处理的科学。计算机数宇图像处理技术是60年代开始出现并伴随着半导体集成电路技术和计算机科学技术而发展起来的一门新兴科学技术,它为图像处理提供了一种精确、灵活、通用的有效方法,并由此而产生了多种图像存储格式和处理算法,使人们对图像的认识提高到一个新的高度,同时也极大地拓宽了图像处理的应用领域

随着计算机技术的发展和图形、图像技术的成熟,图形、图像的内涵日益接近,以致于在某些情况下图形、图像两者已融合得无法区分。利用真实感图形绘制技术可以将图形数据变成图像,利用模式识别技术可以从图像数据中提取几何数据,把图像转换成图形。

多媒体技术的应用中,图像处理是一个重要的组成部分,特别是运动图像的处理是多媒体技术需要进一步解决的关键问题。本章将从几个方面介绍多媒体环境下的图像处理问题,使读者对其有一个基本的认识。

§4.1.1 图像的基本概念

学习图像处理之前,首先要对图像处理中出现的一些概念和名词有所了解,下面介绍一些与图像处理有关的名词和概念。

1.基本名词解释

(1)亮度:是指彩色所引起的人眼对明暗程度的感觉

(2)饱和度:是指颜色的深浅程度,如深绿、淡绿等。

(3)色调:是指光呈现的颜色,如红、绿、黄、紫等。

彩色可以用亮度、色调、饱和度这三个特征来表示。

(4)色度:是色调和饱和度的合称,表示光颜色的类别与深浅程度。

(5)对比度:是指图像中的明暗变化,或亮度大小的差别。

(6)模糊:是指通过减少相邻像素的对比度平滑图像。

(7)锐化:是指增加像素之间的对比度突出图像。

(8)灰度系数:图像中颜色的对比度。

(9)灰度均匀:为得到真实的灰度所需的各种颜色的比例。

(10)噪音:是指同周围点差别过大的点,或者是指与周围像素差别过大的小区域。去噪音就是把每个点都同周围像素相比较,对差别过大者去掉,若小的区域与周围像素差别过大则去掉,较大的区域被柔化。

(11)防模糊:是指使边缘线条平滑的一种方法。

(12)自动色调调节:是指自动将图像的色调至预定义的一组值。

2.基本概念

(1)图像的类型与格式

数字图像的类型有两种,一种是位图,另一种是矢量图形。

①位图即位映射图像,是由描述图像中各个像素点的亮度与颜色的数位集合组成。它存在内中,也就是由一组计算机内存位(bit)组成,这些位定义图像中每个像素点的颜色和亮度。位图图像适合表现比较细致、层次和色彩比较丰富的、包含大量细节的图像。

生成位图图像的软件工具通常称为绘画(Paint)程序,可以指定颜色画出每个像素点来生成一幅画。位图可装入内存直接显示,但是位图所要求的磁盘空间比矢量图形大。

②矢量图形是用一个指令集合来描述的。这些指令描述构成一幅图的所有直线、圆、圆弧、矩形、曲线等的位置、维数和大小、形状、颜色。显示时需要相应的软件读取这些指令,并将其转变为屏幕上所显示的形状和颜色。

产生矢量图形的程序通常称为绘图(Draw)程序,它可以分别产生和操作矢量图形和各个片段,并可任意移动、缩小、放大、旋转和扭曲各个部分,即使相互覆盖或重叠,也依然保持各自的特性,矢量图形主要用于线型的图画、美术字、工程制图等。但是,对于一个复杂的图像,用矢量图形的格式表示,需要花费计算机大量的时间。通常可以用矢量图形方式创建一幅复杂的图像,再在应用程序的使用中将其转换成位图格式。

图像数据文件的格式有很多种,目前微机上比较流行的图像格式有BMP、GIF、PCX、TGA和TIFF等。

(2)分辨率

分辨率是影响位图的质量的重要因素,如屏幕分辨率、图像分辨率和像素分辨率。在处理位图图像时要理解这三者之间的区别。

①屏幕分辨率:指某一种显示方式下,计算机屏幕上最大的显示区域,以水平的和垂直的像素表示。确定扫描图片的目标图像大小时,要考虑屏幕分辨率。

②图像分辨率:指数字化图像的大小,以水平的和垂直的像素点表示。图像分辨率与屏幕分辨率不同,在640×480个像素的屏幕上可以显示320×240个像素,这时,图像的大小是屏幕分辨率的四分之一。当图像大小与屏幕分辨率相同时,图像才能充满屏幕,如果图像的尺寸大于屏幕分辨率,屏幕上只能显示该图像的一部分。这要求显示软件具有卷屏功能,才能看到图像的其它部分。

③像素分辨率:指一个像素的宽和长的比例(也称为像素的长度比),在像素分辨率不同的机器间传输图像时会产生意想不到的畸变。当在不同的图形显示方式或计算机硬件间转移图像时,要考虑像素分辨率。

(3)图像深度

图像深度是指位图中每个像素所占的位数。屏幕上的每一个像素都占有一个或多个位,以存放与它相关的颜色信息。图像深度决定了位图中出现的最大颜色数。目前的图像深度有四种,分别为1、4、8、24。若图像深度为1,表明位图中每个像素只有一个颜色位,也就是只能表示两种颜色,即黑与白,或亮与暗,或其它两种色调(或颜色),这通常称为单色图像或二值图像。若图像深度为4,则每个像素有4个颜色位,可以表示16种颜色。若图像深度为8,则每个像素有8个颜色位,位图可支持256种不同的颜色。自然界中的图像一般至少要256种颜色。如果图像深度为24,位图中每个像素有24个颜色位,因此所包含的不同颜色可达16772216种,称为真彩色(True Color)图像。

由于生成一幅图像的位图时,要对图像中的色调进行采样,因此调色板也随之而产生,调色板是包含不同颜色的颜色表,调色板中的每个颜色都可以用红、绿、蓝(RGB)三种颜色的组合来定义。数字化软件在调色板中为位图中的每一个像素分配一个颜色值,调色板中的颜色数依图像深度而定。

(4)图像处理方法

图像处理的内容极为广泛,如放大、缩小、平移、坐标变换、坐标轴旋转、透视图制作、位置重合、几何校正、灰度反转、灰度变换、图像复原等等。内容繁多,举不胜举。

图像处理的目的是使图像更清晰或者具有某种特殊效果。因此为了不同的目的就要采用不同的处理方法,以下介绍几种主要的图像处理方法。

图像增强

图像增强技术是多种技术的综合效果,它试图改变或改善图像的视觉效果,或把图像转换成某种适合于人工或机器分析的图像形式。图像增强并不是有意识地改善保真度,在对机器的处理的用途中,目前图像增强停留在信息抽取阶段,如高频增强、抽取边缘、轮廓等都是为了抽取进入计算机的信息,使计算机能计算轮廓的大小、形状以及模式识别。

②图像恢复

与图像增强相类似,图像恢复的目的也是改善图像质量。但图像恢复力求保持图像的本来面目,以其保真度为前提。

在图像的形成、传输、存储、记录和显示过程中不可避免地存在着不同程度的变质和失真,图像恢复必须首先建立图像变质模型,然后按照其退化的逆过程恢复图像。常用的图像恢复技术有频域图像恢复、线性代数恢复、非线性代数恢复和运动模糊恢复等。

图像编码图像压缩

由于图像的数据量很大,一般都要经过压缩(或编码)后才进行存储和传输。在这个处理过程中,与所选的压缩算法有关,并可能会对图像本身产生影响。如果采用无损压缩,压缩比不太高,而采用有损压缩,则可能会对图像质量有影响,因此需要选取一个合适的折衷办法。同时,压缩也会对实时性产生影响,具有一定的延迟,因此在应用时应充分考虑压缩与解压缩所带来的时间延迟问题。采用硬件来实现,会大大缩短由压缩和解压缩带来的延迟。

④图像的编辑

将图像转化为最终的可供表现用的图像,图像的编辑是必不可少的。图像编辑包括图象剪裁、图像旋转、图像缩放、图像修改、图像综合叠加等。通过图像编辑,可将原始图象中不足之处去掉或修补,也可将几幅图像综合成一幅,还可以把文字、图形等增加进图象中,成为图像中的一个组成部分。

总之,图像处理方法繁多,图像的处理是一个十分复杂的问题,也是一个很专业化的研究领域。

§4.1.2 图像的数字化

1.什么是图像的数字化

图像是我们日常经常接触到的熟悉的东西,据统计,人类所获得的信息中,约有75%是以图像的形式获得的。如光学图片、照片、图片以及人眼看到的一切景物图像等,它们有一个共同的特点是其亮度的变化是连续的,即所谓模拟图像。模拟图像只能用摄像机、照相机等进行摄取,但无法用数字计算机来进行处理。

数字计算机只能处理数字信息,若要使其能处理图像信息,必须将模拟图像转化为由一系列离散数据所表示的图像,即所谓数字图像。这一将模拟图像转化为数字图像的过程称为(模拟)图像的数字化。图像数字化过程包括下面二个步骤:

(1)抽样。抽样就是将二维平面上模拟图像的连续亮度(即灰度)信息转化为用一系列有限的离散数值(或抽样点)来表示。

具体作法是设定一定的宽度(通常称为抽样间隔),在水平和垂直方向上将图像分割成矩形点的网状结构。

抽样结果是整幅图像画面被划分成了称为像素点的矩形微小区域。若每行有m个像素点,每列有n个像素,则整幅图像为由m×n个像素构成的离散像素点集合。为使一幅图像既能得到满意的视觉效果,且总数据量最少,一般需要针对图像的具体内容来确定相应的m和n值。

例如:汉字,根据字的大小要求,每个字从16×16到256×256点阵。

显微镜图像,256×256到512×512点阵。

电视图像,(500~700)×480点阵。

抽样得到的各像素点的亮度值取值空间仍是连续的,称为脉冲幅度调制(PAM)信号,它仍然是模拟信号,必需进一步量化。

(2)量化。量化就是将亮度取值空间划分成若干个子区间,在同一子区间内的不同亮度值都用这个子区间的某一确定值代替,这就使得取值空间离散化为有限个数值。因此我们说,量化即是用有限的离散数值量代替无限的连续模拟量的多对一的映射操作。子区间的个数(即取值个数)称为量化级数,把量化后的取值用二进制码来表示称为编码,亮度值所取的二进制位数称为量化字长。量化后的信号称为脉冲编码调制(PCM)信号,它具有较强的抗干扰能力。

例如,量化后若每个像素的亮度值用一个字节来(8位)表示,把黑—灰—白亮度的连续变化模拟量化0~255之间的整数值,共256个灰度级别或256个灰度值。量化后的灰度值即反映了对应像素点的亮度值或明暗程度。

经抽样与量化后,一幅模拟图像就离散化为m×n字节的数字图像,可由数字计算机进行处理。

要注意的是,图像的数字化过程使连续模拟量变成了离散数字量,相对原来的模拟图象,数字化过程带来了一定的误差,会使图像重现时有一定程度的失真。但由于人眼的空间分辨率和亮度层次分辨率都受到客观局限,只要恰当地选取抽样间隔与量化级数,上述误差是可以忽略的。

2.数字图像的优点

既然已有模拟图像,为何还要采用数字图像。这是因为相对于模拟图像,数字图像在处理上有以下的优点:

(1)精确度高。目前的抽样技术可以达到每毫米抽样为80个或更多的像素点,每一个计算机所要存储和处理的数据量也随之增加,这就需要亮度的量化位数可为8bit和16bit等。当然,随着抽样量化位数的增加,计算机所要存储和处理的数据量也随之增加,这就需要根据具体情况在精确度和数据量之间取得平衡。

对数字计算机来说,只要处理图像的计算模型确定后,原理上不论多高精度的图像处理都是可以实现的。而对模拟图像作处理时,为要把精度提高一个数量级,就必须大幅度地改进硬件处理设备。

(2)再现性好。数字图像不同于模拟图像,它的图像信息是用数字来表示的,其抗干扰的能力为模拟图像所无法比拟,不会因存储、传输和复制而产生图像质量的退化,从而能够准确地再现原图像。

(3)灵活性大。模拟图像的处理通常只能作有限的若干种运算,极大地限制了对它的处理和应用范围。而对数字图像来说,凡可用数字公式或逻辑表达式来表达的一切处理运算,都可用数宇处理来实现。

数字图像的缺陷是处理的速度慢,所需的数据存储空间大,从而使数字图像的处理成本增高。但随着半导体技术的发展,计算机的处理速度提高很快,存储容量随着光盘技术的发展不断增大,数字图像处理已达到了实用化的阶段。

(4)适用面宽。图像有多种多样的信息源,但不管何种信息源的图像,在数字化以后,对计算机来说,都是一幅由点阵构成的图像,都可以用计算机来处理。也就是说,数宇图像的处理方法适用于各种类型的图像。

表4-1列出了几种图像处理方式的比较,可看出图像的数字化有许多明显的优点。

表4-1 图像处理比较表

3.数宇图像的表示方法

一幅模拟图像经数宇化处理后,可用M×N个像素点表示,若每个像素点的亮度值取一个字节,则共需要M×N个字节的存储空间。对于数字计算机来说,可用一个M×N维的数组F(Xi,Yj)来表示。

即F(Xi,Yj)=(Xi,Yj)点处像素的亮度值,i=1,2,3,......,M,j=1,2,3,⋯⋯,N,图像的形式种类是多种多样的,我们通常所接触到的一些图像类型其数字化表现形示如表4-2所示。

不同类型的数字图像其数组表示的取数范围是不同的,它们所需的存储空间也有相当大的区别:

(1)二值图像。一切文字和工程图纸等经数字化后均可用二值图像的形式来表示,这是一种常见的图像。

二值图像是黑白灰度图像的一种特殊情况,也是最简单的一种;图像点阵的内容只有黑白两种情况。

它的每一个像素只有两个灰度值,即每个像素可以只用一位二进制码表示,如用0表示白,用1表示黑。因此二值图像的表示所需的存储空间在各种数字图像类型中是最少的。

表4-2 常见数字图像类型描述

(2)黑白图像。与二值图像相比,黑白灰度图像的图像像素点阵内容是由介于黑与白之间的多层次灰度构成的,通俗的来讲就是各点黑白深浅度不同,从而形成了有视觉层次轮廓的一幅图像。

黑白图像的灰度层次是连续的,数字化后量化为有限个灰度层次值,它比二值图像需要较多的存储容量,量化级数或灰度层次越多,则图像的再现性就越好,耗费的存储空间也越多。

量化字长是衡量图像再现性和占用存储量的重要指标,它决定了量化的级数,量化级数对图像恢复的平滑度影响很大。随着量化级数的减少,图像就失去了恢复平滑的特点,出现假轮廓。即原来灰度平滑变化的部分,由于量化级数的减少而使灰度产生跳跃性的变化,从而导致画面上出现假轮廓,而非原来图像固有的。假轮廓随着量化数的减少而越来越明显,量化级数最少的极端情况就是二值图像。对人眼的分辨率来说,要求量化级数达到50层以上才能获得满意的效果。

(3)彩色图像。彩色图像在人的视觉中具有丰富多采的颜色结构,它更为逼真的反映了现实世界。各种各样的颜色都是由红、绿、蓝三基色按不同比例调和而成的,在一幅彩色图像的像素点阵中,每一个像素点信息由三基色各自的亮度值构成,与相同幅度的黑白图像相比,在量化字长相同的情况下,彩色图像所需的存储容量是黑白图像的数倍,要占用更多的存储空间。

(4)活动图像。活动图像由一系列时间序列图像画面组成,画面之间的显示或播放顺序具有时间先后关系,图像画面的连续播放产生运动的视觉效果。

活动图像不仅需要巨大的存储容量,而且传输速度也有很高的要求,这样才能保证实时性和良好的视觉效果。

4.数字图像的处理

数字图像处理是按特定的目标,用一系列持定的操作来“改造”图像,使之更清晰、更鲜艳。当然数字图像的处理也包含了从图像中提取某些特定的信息操作。数字图像的处理的内容可概括为以下四个方面:

(1)图像像质改善

由于原始景物的图像信息在传输途径上往往会掺入随机干扰,图像的采集设备(如照相机、摄像机等)一般都不可能绝对准确地采集图像信息,即任何图像采集设备都必然不同程度地把噪音信息加到所采集的图像信息上。因此,早期的图像处理的基本内容就是改善图像的质量,其目标是使图像更为清晰、准确,具体的技术措施大致如下:

①锐化 锐化是突出图像上灰度突变的各种边缘信息和增大图像对比度的措施,使图像上的轮廓信息更清晰。

②平滑 平滑是一种通过抑制噪音而达到改善图像质量的措施,经过平滑处理,可修整图像画面的“毛刺”,使线条更加流畅。

③复原 复原又称为恢复,是根据引起图像质量下降的原因而采取的一种恢复该图像本来面目的处理措施。

④校正由于图像采集系统非线性或摄像时角度的影响,都可能使得到的图像产生几何失真。为了要得到几何形状准确的图像,就必须采取几何校正措施。

(2)图像分析

图像分析是一种自动从图像中提取各类基本特征的技术措施,这些基本特征的提取将为进一步综合提取全图像的有用信息打下基础。图像分析具体包括:

①边缘与线条的检测。

②图像区域的分割。

③形状特征测量。

纹理分析。

图像匹配

(3)图像重建

图像重建是随数宇图像处理技术的应用而发展起来的一个分支,它主要包括应用于CT中的投影图像重建,测量上的用左右视图生成立体图像的技术。图像重建技术在医疗测绘、工业检测等领域已产生了巨大的社会效益与经济效益。

(4)图像数据压缩

以数字图像取代传统的模拟图像具有许多优点,但大量、广泛使用的数字图像有一个主要的障碍,这就是数宇图像的数据量巨大,例如要存储一幅标准的VGA模式(640×480×256)的图像,大约需要0.3MB,若要求达到每秒25帧的全动态显示,每秒钟所需存储容量约为7.5MB,650MB的光盘只能存放1分44秒的图像数据,而且光盘的数据传输率也必须达到7.5MB/s以上才能满足要求,以CD-ROM驱动器150KB/s的指标而言,数字图像数据必须压缩50倍以上,这还不包括它的伴音信息和其它数据信息。因此,图像数据压缩是图像处理中的关键技术。

数据压缩技术经40年的发展,已进入了比较成熟的实用阶段。针对不同的数据类型,产生了不同的压缩(或称为编码)方法。多媒体图像处理中常用的图像压缩方法有两类:

①无失真压缩方法(或称可逆编码方法),此种方法解压缩后的图像与原始图像严格地相同,即压缩的原始数据是完全可恢复的或没有偏差的,这是无损压缩(不失真的图像编码)方法,无损压缩方法不能提供较高的压缩比。多媒体技术中常用的无损压缩算法有:哈夫曼编码、算术编码、行程编码等。

②有失真压缩方法(或称不可逆编码方法),此种方法的还原图像较之原始图像存在一定的误差,但视觉效果一般是可以接受的,即主观图像是令人满意的,本方法大多被使用在把人类视觉作为观测对象的场合下,是有损压缩(有失真的图像编码),但此种方法可提供较高的压缩比。多媒体技术中常用的有损压缩算法有:预测编码、变换编码、子带编码、矢量量化编码、混合编码、小波编码等。

大多数常用的图像压缩标准,都是上述两类方法的混合使用,例如JPEG、MPEG等。评价种图像压缩方法的优劣,须综合考虑如下因素:

①图像信息压缩比,即压缩前后所需的图像存储量之比。压缩比是估价图像压缩方法性能的一个重要表征参数,图像的压缩比指示了图像压缩的困难程度和可能性。压缩比越大,说明数据压缩的程度越高,压缩的技术处理越复杂。

②实现压缩/还原算法的难易程度和执行速度,即在进行压缩/还原数据时执行速度的快慢及用硬件实现压缩/还原的成本。速度越快,压缩算法的效率就越高,从而越具有实时性。

③再现精度,即还原出来的图像质量与原图像相比有多大失真度,以视觉感受协调、明亮、清晰、鲜艳为好。

在实际系统中,往往可以根据应用的具体要求灵活控制图像压缩方法的有关参数,以达到最佳效果。

§4.1.3 图像数据压缩原理和编码方法

图像的压缩和解压缩是一对作用互逆的运算过程。压缩是在不同程度之上保存图像的原始信息而减小图像数据量的编码过程。解压缩(还原)是根据压缩过的码元恢复出原始图像。能否完全恢复出原始图像,取决于压缩编码过程是无损压缩还是有损压缩。

1.图像数据压缩的基本原理

前面已经提到过,数字图像中包含着巨大的数据量,若不将这些数据进行压缩而直接存入计算机中,所需的空间是非常巨大的。例如:在显示屏上的120×100窗口大小,8位256种颜色,以每秒30帧的速度播放,则播放一分钟视频图像所需的空间为120×100×8×30×60=1728000000,约为1.7G位,以普通硬盘的容量,仅够播放几分钟,可见要将不经过压缩的数字图像存放到计算机里是完全不实际的。

要解决数字图像处理大容量高速度问题的途径有两个:一是提高计算机本身的存储容量,如采用光盘存储技术;增强主机的处理速度,如采用高速的CPU。二是对图像数据进行压缩处理。在保证一定的图像质量和满足任务要求的前提下,减少原始图像数据量的处理过程称为图像压缩。

(1)图像数据压缩的可行性

图像数据看起来虽然是无规律的,但按照统计学的观点,一幅图像画面的灰度或色彩的分布具有块状结构,图像的内容整体上有结构性,各像素间具有位置上的相关性,利用这些特征就可用较少的数据量来表示一幅图像,从而实现对图像数据的压缩处理。

图像数据可以被压缩,说明了在图像数据内部存在着数据的冗余性,因此可针对不同类型的数据冗余,使用不同的压缩方法。

在图像数据中,一般存在如下一些数据冗余类型:

①空间冗余 任何一幅静止画面或动态画面都存在很大的冗余度,通常画面上各个局部均有许多灰度或颜色都相同的邻近像素,它们形成了一个性质相同的集合块,它们相互之间具有空间(或空域)上的强相关性,在画面上表现为灰度或颜色都基本相同的视觉区域,我们就说在这个区域中有数据冗余,并称之为空间冗余。

对空间冗余的压缩方法就是把这种集合块当作一个整体,用极少的信息量来表示它,从而节省了存储空间,这种压缩方法叫作空间压缩(Spatial Compression),或帧内压缩,它的基本点就在于减少邻近像素之间的空间(或空域)相关性。

②时间冗余 对动态画面(视频或动画)来说,图像序列中连续显示或播放的相邻两幅图像之间有许多部分是重复的,即前后相邻两幅图像之间具有时间(或时域)上的强相关性,我们就说这相邻两幅图像间有数据冗余,叫作时间冗余。

空间冗余和时间冗余,是将图像信号看作为概率信号时所反映出的统计特征,因此这两种冗余也被称为统计冗余,它们也是多媒体图像数据处理中两种最主要的数据冗余,由于多媒体数据中存在着大量数据的冗余,因此说多媒体数据是可以被压缩的。

在多媒体技术的应用领域中,人的眼睛是图像信息的接收端,人类的视觉系统并不是对图像画面的任何变化都能感觉得到,视觉系统对于图像场的注意是非均匀和非线性的,即注重主要部分质量,同时取画面的整体效果,不拘泥于每一个细节。

例如,人的视觉对于边缘的急剧变化不敏感,且人眼对图像的亮度信息敏感,对颜色的分辨率弱等。因此,对压缩或量化而使图像发生的变化(或称引入了噪声),如果这些变化不能被视觉所感觉,就仍认为图像质量是完好的或是够好的,即图像压缩并恢复后仍有满意的主观图像质量。

图像数据除了具有上面所说的各种冗余外,还存在一些其它的冗余类型。冗余的理解在于,可采用某种方法以较少的数据来近似表示大量的数据,它是实现数据压缩的前提。

(2)图像数据压缩与解压缩处理一般过程

从总体概念而言,图像数据压缩处理一般是由两个过程组成:

①编码过程(压缩)。将原始数据进行编码,实际就是对其按某种方法进行压缩,以达到节省存储空间与数据传输量。因而编码过程就是数据压缩过程。

②解码过程(解压缩)。解码过程是对编码数据进行解码,亦即将压缩了的数据进行解压缩,还原为可以使用的数据。因此解码过程就是还原压缩数据的过程。

一个数据压缩系统可用图4-1概括地表示。

图4-1 图像数据的压缩与解压缩过程

数字图像压缩技术通常都相当复杂,如果完全由计算机的CPU来处理,则要增加CPU相当大的负担。解决办法之一是使用压缩协处理器,在硬件的支持下,一台计算机的数据压缩能力可以提高300倍,这意味着对信号可以做到随来随压缩。

2.图像数据压缩的基本编码方法

数据的压缩都可以看成是一种变换,解压缩(恢复数据)就是一种反变换,变换的实现方法即编码技术。每一种编码方法都是实现数据压缩的具体操作,对于不同的图像类型,可有选择地采取某种编码方法。

自从1948年提出PCM编码理论开始,编码技术发展很快,图4-2为编码算法的分类图。

(1)预测编码

预测编码是针对图像数据的统计冗余进行压缩的方法。它主要是减少数据在空间和时间上的相关性,达到对数据的压缩。

①对空间冗余来说,预测编码反映了同一帧图像内,相邻像素点之间的空间相关性较强,因而任何一个像素点的亮度值,均可由它相邻的已被编码的像素点的编码值来进行预测。

图4-2 图像编码算法分类图

如果预测是根据某一预测模型进行的,且模型表达得足够好,则只需存储或传输某些起始像素点和模型参数就可以代替整个一幅图像了。这时只要编码很少的数据量,是一种极端理想的情况。

但实际上预测不会百分之百准确,例如在图像边界处交界处预测就往往失败,此时可将预测的误差值(实际值与预测值之差值)存储或传输。一般来讲误差值比实际值要小得多,这样在同等的条件要求下,就可以减少数据编码的比特数,从而也减少了存储和传输的数据量,实现了数据的压缩处理。

②时间冗余的预测完全类似,只是将帧内换为帧间预测,因为时间序列图像的相邻图像帧之间有着许多相同的部分,则在原理上可以只存储和传输相邻帧之间的差异部分,从而使处理的数据量大大减少,但是它的压缩比非常依赖于图像帧序列之间的数据相关程度。

预测编码中典型的压缩方法有DPCM和ADPCM等,它们比较适合图像与声音数据的压缩。因为这些媒体的数据均由采样得到,相邻采样值之间的差值都不太大,可用较少的比特数表示差值。

预测编码通过去除数据之间的相关性,实现对数据的压缩。是一种有失真编码方法。

(2)变换编码

这也是针对统计冗余进行压缩的方法,变换编码先对信号进行某种函数变换,从信号的一种表示空间变换到信号的另一种表示空间,然后在变换后的域上,对变换后的信号进行编码。如变换编码中典型的例子就是傅立叶变换,它将信号时间函数变换成频率函数,编码在频域上进行。变换编码的编码与解码过程如图4-3所示。(www.xing528.com)

图4-3 变换编码编码与解码过程

由图可见,变换编码不是直接对原图像信号压缩编码,而是首先将图像信号映射到(变换到)另一个域中,产生一组变换系数,然后对这些系数量化、编码、传输。在空间上具有强相关性的信号,反映在频域上是某些特定的区域常常被集中在一起,或是变换系数矩阵的分布具有规律性。因此可利用这些规律,在不同的频域上分配不同的量化比特数,从而达到压缩数据的目的。

实践证明,无论对单色图像、彩色图像、静图像还是运动图像,变换编码都是非常有效的方法。变换编码是一种失真编码方法,采用不同的变换方式,压缩的数据量和压缩速度都不一样。

(3)矢量量化编码

矢量量化编码是近年来图像、语音信号编码技术中频为流行的一种新型量化编码方法。矢量量化利用相邻图像数据之间的高度相关性,将输入的图像数据序列分组,每一组m个数据被描述成为一个有m个元素的矢量,让每一个矢量与码本中的矢量(码宇)比较,找到最佳匹配,而以与该矢量达到最佳匹配的码字的序号对该输入矢量进行编码,从而达到一个矢量所需要的比特数到一个码字序号所需比特数的压缩。矢量量化是一种有失真编码方法,其名宇是相对于标量量化而提出的,该方法对声音和图像数据特别有效。其原理框图如图4-4所示。

图4-4 矢量量化原理框图

输入量是一个待编码的k维矢量,即先将输入的整幅图像分割成M个方块,每个块的尺十寸为n×n的像素点阵,然后把每一个方块阵按列(或行)堆叠成k(k=n×n)维矢量,作为编码的输入矢量。

码本C是一个k维矢量的集合,表示为C=(Yi),i=1,2,......,N。即其实际是一个长度为N的线性表,这个表的每一个分量是一个K维矢量Yi,称其为码字。因而也可以说所有码字构成的集合称为码本。在接收端与发送端都各有一个完全相同的码本C,用于信息的编码和解码。

矢量量化过程是从码本C中,搜索一个与输入矢量最接近的码宇Yi的过程。

一般来说,在码本中寻找到与输入矢量完全一致的码字的概率很小,但只要二者之间误差最小时,便可用该码字Yi来代表输入矢量。因此矢量量化过程就必须存在着量化误差。

信息传输时,并不传输码字Yi本身,而只是传送其下标i。当码本长度为N,则为传送下标所需的比特数为log2N,传送一个像素所需的平均比特数为1/k×.log2N

矢量量化编码的关键问题是设计一个良好的码本,这是十分困难的事,目前还没有十分理想的算法。矢量量化的初级阶段多采用计算机模拟。

(4)子带编码(分频带编码)

无论是语言信号或者是图像信号都有较宽的频带,不同频域段的信号编码后,对恢复原信号的质量产生不同影响。

在变换编码中,采取保留低频系数,将高频系数部分舍去的办法,即低频部分比高频部分取较多的比特数来编码。这样做的结果是以牺牲边缘细节为代价来换取比特数的下降,因而恢复后的图像总比原图像视觉效果要模糊一些。

子带编码把原始输入图像分割成不同频段的子频段带,对不同频段的子频带各自设计独立的预测编码器,分别进行编码和解码。子带编码的特点在于有较高压缩比和信噪比。其编码原理图如图4-5所示。

图4-5 子带编码原理图

(5)信息熵编码

信息的熵通俗来讲就是指数据所携带的信息量。熵编码的目的是要减少符号序列中的冗余度,提高符号的平均信息量。它根据符号序列的统计特性,采取某种方法把符号序列变换为最短的码字序列,使各码元承载的平均信息量最大,同时又能保证无失真地恢复原来的符号序列。熵编码的实质在于利用信息的相关性来压缩冗余度,是唯一的不失真变长编码方法。实现这种编码的方法有申农(Shannon)编码和哈夫曼(Huffman)编码方法等。

哈夫曼编码的基本方法是:把原信息源的各个符号的序列按概率递减的顺序排列起来,求其中概率最小的两个符号的概率之和,并把这个概率之和看成是一个符号的概率,再与其它符号依概率递减的顺序排列。然后,对参与概率求和的两个符号分别赋予二进制数字1和0,如概率大的赋于1,概率小的赋于0,反之亦可。如此进行下去,直到剩下两个符号的概率为止。最后,按照与编码过程相反的顺序读出各个符号所对应的二进制数字组,就得到该符号的码字。

哈夫曼编码方法是一种最优化的编码方法,它使得码元承载的平均信息量达到了最大,有效地实现了信息的压缩。编码的结果对出现频率较高的符号分配短码字,对出现频较低的符号分配较长的码字,以这种方法编码的平均字码长度一定小于按其它任何符号顺序排列的平均码字长度。该方法易于硬件实现。

然而,此种方法依赖于被编码的原始数据的概率特性,对于各种类型的图像,其概率统计特性可通过统计的方法得到,但在实际应用时这一点却要受到许多具体条件的限制,造成哈夫曼编码法对不同的信源其编码效率不一样,只有在概率分布很不均匀时,编码才会收到显著的效果。换句话说,在信源概率分布均匀的情况下,一般不使用哈夫曼编码方法。

因此,在JPEG标准中制定了一些供参考的哈夫曼编码表,称作哈夫曼表,可供编码时使用。尽管哈夫曼表是在大量经验数据上制定的,但毕竟与具体编码的数据源很难完全一致,因而通常得到的哈曼编码是一种次优的编码。

申农编码只是指出了存在一种无失真的编码,使得编码的平均码长达到或逼近某个极限的最小值,但没有给出具体的编码方法。

§4.1.4 图像压缩编码标准

图像数据压缩方法目前已形成了一些国际标准和商品化的产品,其主要代表有三大压缩标准:JPEG静态图像压缩标准、MPEG运动图像压缩标准和P×64Kb/s标准。

1.JPEG压缩技术

JPEG是Joint Photographic Experts Group的缩写,意为联合图像专家组。此标准是由ISO/IEC(国际电子技术委员会)和CCITT联合制订的第10918号标准,适用于连续色调、多级灰度、彩色或单色静态图像数据压缩,如黑白及彩色照片、图像文献资料、彩色传真和印刷图片等。

JPEG定义了两种基本压缩算法:一种是基于差分脉冲码调制(DPCM)的无失真压缩算法,另一种是基于离散余弦变换(DCT)的有失真压缩算法。目前多媒体技术中使用的是后一个算法。

JPEG压缩算法的过程如下:

(1)通过DCT映射变换减少数据冗余度;

(2)对DCT变换系数利用视觉加权函数进行量化;

(3)差分编码和行程编码;

(4)哈夫曼编码。

解压缩是上述过程的逆过程。

JPEG作为静止图像的压缩标准,其压缩比为(8~100)∶1之间,压缩后的一个像素点可用0.25~2比特存储,它与图像质量的关系如表4-3所示。

表4-3 压缩比特数与图像质量的关系

JPEG标准的压缩编码和解码是有失真的,压缩效果与图像内容本身有较大的关系,高频成分少的图像要比高频成分多的图像获得高一些的压缩比,且还具有较好的图像质量。

2。MPEG运动图像压缩标准

MPEG是Move Picture Experts Group的缩写,意即运动图像专家组。是ISO/IEC委员的第11172号标准草案,这是一个通用的标准,MPEG算法是完全针对CD-ROM或电缆电视进行的运动图像的压缩而制定的,既考虑了应用的要求,又独立于具体应用之上。它不但在帧内压缩,同时对帧与帧之间的冗余数据进行编码压缩,从而大大提高了压缩率。MPEG标准其压缩比可达到(80~275)∶1,视频信号可压缩到0.5~1位/像素。

MPEG的工作不仅仅局限于运动图像编码,因为在很多场合声音和图像是联系在一起的。MPEG标准包括三个部分:(1)MPEG视频;(2)MPEG音频;(3)MPEG系统。MPEG视频是标准的核心,面向位速率为1.5Mb/s全屏幕运动图像的数据压缩;MPEG音频是面向每通道速率为64、128和192kb/s的数字音频信号的压缩;MPEG系统则要解决多种类型的压缩数据流(如音频和视频压缩数据流)的同步问题。

MPEG视频压缩是核心问题。实现MPEG视频数据压缩算法的困难在于:要在保证图像质量的前提下具有高压缩比,则压缩算法就不能只靠帧内压缩实现;而为了使得压缩后的数据具有随机存取的灵活性,采用单纯的帧内压缩就不能充分做到这一点。MPEG通过帧内和帧间混合的方法解决上述问题。

MPEG是一个非对称的压缩算法,压缩算法的计算量比解压缩算法要大的多。其压缩编码过程是先对音频和视频信号采集,数字化后各以独立的文件存储,然后对音频和视频数据压缩,它的播放是对多种数据的处理过程。

3.P×64标准视频压缩技术

P×64标准是针对视频传输制定的标准,是CCITT的H.261号建议,这个建议支持实时活动图像的压缩编码与解码,其应用目标是为了在综合业务网上提供可视电话和电视会议,适用于64kb/s的通信线路。P×64kb也是有关视像和声音双向传输标准的总称,P是一个可变参数,取值范围是1至30,P×64表示是以64k位/秒的倍数作为传输速率,当P是1或2时,传输速率较低,只支持QCIF(Quarter Common Intermediate Format)分辨率格式(所需最低速率为64kb/s),每秒帧数较低的可视电话;当P等于或大于6时,则可支持图像分辨率格式为CIF(Common Intermediate Format)的电视会议(所需最低速率为320kb/s),传输速率的提高使得复杂的画面也能实时传输,图像质量也得到改善。

P×64kb/s视频编码压缩算法是采用混合编码方法。即基于DCT的离散余弦变换编码方法和带有运动预测的差分脉冲编码调制(DPCM)预测编码方法的混合。P×64kb/s标准的压缩算法与MPEG压缩算法有许多共同之处,只是在传输比特率上P×64kb/s覆盖较宽的信道频带(当P取值不同时),而MPEG是基于较狭窄的频带上传输。它们之间的区别在于P× 64kb/s的目标是为了适应各种信道容量的数据传输,信道能力不同则调整参数,而MPEG的目的是要在狭窄的频带上实现高质量的图像和高保真度声音的传送。

以上三种压缩标准的比较如表4-4所示。

§4.1.5 彩色视频信号的编码

在电视、可视电话、图文传真等图像系统中,为了有效地使用通信干线信道,以较快的速度传输图像。已研制了不少图像编码系统,这些系统能够以较少的代码比特数传输,并以令人满意的质量恢复图像。

表4-4 三种压缩标准的比较

1.彩色视频信号

根据三基色原理,用红绿蓝(RGB)三种颜色可以合成一幅图像中的任何彩色,视频信号的彩色正是这样生成的,用三基色红绿蓝信号可生成所有的彩色视频信号,可以说RGB构成了一个三维的彩色空间。

对黑白视频画面经过采样量化后,若每像素量化为8bit,可表示256个灰度级别,若量化为16bit,则可表示65536个灰度级别。对彩色视频画面的采样量化,可有各种标准,如8bit、16bit或24bit、32bit等,且其中R与G及B之间各自所占的比特位数,根据具体情况可采取不同的比例。

由于人的视觉系统对彩色色度的感觉和亮度的敏感性是不同的,因此产生了不同的彩色空间表示法,它们可通过坐标变换来相互转换,例如:

(1)H、S、I彩色空间,它比R、G、B彩色空间更符合人的视觉特性。

其中:H(Hue)为色调,S(Saturation)为饱和度,I(Intensity)表是光的强度和亮度。

(2)不同的电视制式其视频采用了不同的彩色空间表示。

PAL(西德)制式采用了Y、U、V空间。

CD-I和英特尔的DVI也采用了Y、U、V空间。

其中:Y是亮度信号,U和V是色差信号。RGB与YUV的转换关系为:

反之:R=Y+V G=Y-0.19U-0.51V B=Y+U

彩色视频信号的数据压缩可以基于R、G、B信号或Y、U、V信号,我国所实行的彩色电视PAL-D制式,是把R、G、B三基色值信号转换成Y、U、V信号进行处理。

利用Y、U、V表示信号的特性可产生一些有用的图像处理效果。如把一幅彩色图像变成黑白图像,只需将U、V分别置0,还可利用人眼对亮度信号敏感,对色差信号U和V不敏感的视觉特性来降低U和V分量的分辨率,即减少表示它们的数据比特数,例如,一般Y、U、V采用4∶2∶2或者4∶1∶1的格式,可以减少图像数据的存储量和传输带宽,从另一角度达到信息压缩的目的。

2.彩色视频信号编码与解码过程

对于数字式的视频显示系统,是用数字位串来表示图像信息的,最典型的就是计算机的显示系统。在计算机里,视频显示的信息在计算机的视频存储区中被表示为二进制位的模式,通过连续从这个存储区域中读取数据,转换为视频信号,就可在光栅扫描的显示器上构成显示。这些处理在计算机内是通过专门的硬件插卡来完成的,通常称为视频显示适配卡。

一般来讲,计算机的视频显示系统与模拟电视视频显示系统相比,前者远没有后者的图像画面效果逼真。在这一点上,可通过把模拟图像转换为数字图像的方法来加强数字图象显示的逼真性,同时实现模拟视频信号的采集和编码,进行压缩存储传输,以后又可以令人满意的质量恢复原图像。这就是视频图像信号的数字编码技术。其基本原理如图4-6所示。

图4-6 彩色视频信号编码与解码过程

原始彩色图像的R、G、B信号,经过坐标空间转换生成Y、U、V信号,再经A/D转换(抽样量化)得到数字信号。

A/D转换后映射变换的作用是将原始图像在另一个域中表示,改变图像数据的某些特性,减少数据的冗余度,使在变换后的表示域中能用较少的比特数量化编码。不同的变换方法,所采用的编码方法也不同。对实现变换的变换器要求能有效地压缩数据,速度快及经济实用等。映射变换一般来说都是可逆的,没有信息损失。

若不经映射变换直接对A/D变换后的数字信号进行编码是最基本的编码方法,称为脉冲编码调制(PCM)。PCM编码方法可分固定和自适应两种情况,这种编码方法对每个采样点分配以固定长度的码字。量化对量化器的要求是,在一定的客观允许误差和图像损伤不影响主观视觉的条件下,总的量化比特数要尽量地少,同时也便于实现。量化器是致使图像失真的根源,量化是以图像的失真为代价换取比特数的下降,以达到数据压缩的目的,所以比特数与保真度二者之间要折衷考虑。变换、量化、编码是图像数据压缩的三个基本环节。

信道传输后进行的解码过程是编码的逆过程。通过解码完成数据的解压缩,把它转换为模拟信号,再经坐标变换把YUV信号变为RGB信号送显示器显示。

§4.1.6 多媒体视频图像的播放

1.视频图像的播放

为了实现播放视频图像,目前主要采用以下四种基本技术:

(1)软件技术

通过软件程序以每秒较少幅(如每秒15幅)的速度在较小的窗口里播放视频图像。但随着窗口的增大,图像质量将变差,播放效果的连续性也变差。

(2)视像卡

使用视像卡通过录像机等设备将视频信号输入计算机并转换成VGA模式信号,可以文件的形式存储在磁盘上,又可以把VGA格式的信号转换成PAL等制式的视频信号,并向电视机输出演播。

(3)模拟直接播放

将视频信号(如电视或录像机等信号)通过视频卡直接送显示器屏幕来播放视频图像。视频卡仅适合于对图像的存储与显示的应用,当对数字化后的信号要进行大量数据处理,处理时间有严格要求时,不宜选用视频卡,因它通常不支持图像的压缩和编缉。

(4)实时压缩与解压技术。

实时压缩与解压技术通常是采用专门的硬件芯片,如视频实时压缩芯片等。使用这种芯片时,对播放的视频图像必需用相同的芯片预先录制,录制芯片压缩数据,视频卡芯片还原数据。视频压缩芯片(卡)具有的视频捕捉和压缩功能,可将视频信号实时转为数字信号在VGA上开窗显示,按要求将视频信号实时压缩存入硬盘,并可实时解压缩回放。这样大大减少了数据的存储和传输量,且播放的速度可达到正常的视觉要求,图像质量良好。

2。视频与音频的同步

电影和电视等的图像是由无数的帧序列构成的,通过快速地播放图像帧,由于人眼的视觉滞留效应而产生连续运动的效果,所以说帧是构成视频图像的基本信息单位。

视频信息播放的同时,一般都伴随有音频信息的播放,这样才能构成完整的视听效果。这就需要将视频信息和音频信息有机地结合起来,形成一个统一的整体。

例如,模拟录像带记录就是将带子横向分为两个区域,其中一个区域用来记录视频信息,另一个区域则记录音频信息。在播放时,将视频和音频信息同时播放,从而形成两者的有机结合,产生同步效果。

又如模拟电视信号的视频和音频信息是叠加同时传送的,电视接收到信号后,由相关的部件把它们分离出来,再送往各自的电路播放出来,产生视听效果。

当以数字方式记录模拟视频和音频信息时,必须同步地捕获视频和音频信号,以后才可以同步地回放。为了做到这一点,至少要产生三种类型的文件:一是数字视频文件,记录图像信息;二是数字音频文件,记录伴音信息;三是保证同步的数字信息文件,它记录了视频和音频之间的时间关系,实现视频与音频的同步播放。

在实际的播放过程中,同步文件协调方式为:当视频信息播放时,不断地将音频信号的当前时间标记与同步文件中的时间信息比较。如果音频滞后视频,那么延迟下一视频帧的显示,直到视频与音频信息同步;如果音频超前于视频,就要丢弃当前视频帧,而取下一视频帧播放,如此反复比较,直到二者同步。

在光盘上,视频与音频信息也是数字形式,它们是混合交叉存放的。数据是由一系列不可中断的记录单元组成,在一个记录单元中包括了数据控制区,用来控制音频和视频的再现与同步,另外在数据控制区后还有音频数据区、视频数据区以及与程序有关的数据等。这样在读取光盘信息时,就可根据这些数据,实现音频和视频的同步播放。

3.视频处理的硬件实现

(1)数字视频硬件

数字视频处理硬件包括视频卡和视频编码卡,分别完成模拟视频到VGA和VGA到模拟视频的转换功能。一种是图像静态压缩卡,一种是视频动态压缩卡。

视频卡的主要功能是将视频信号在VGA上开窗实时播放,并可捕捉图像存盘,同时支持Video for Windows动态捕捉视频信号。

PC机本身处理视频已经有了标准设备:VGA显示卡和显示器。借助Microsoft公司的Video for Windows可以完成视频播放、编辑等功能。但如果要摄取自己的视频节目,则需要视频抓取卡(Video Capture Card),最简单的视频抓取卡只能获取单帧,常见的视频抓取卡能够抓取连续帧,以AVI文件格式保存到硬盘上,较好质量的视频抓取卡带有硬件压缩器,如果没有硬件压缩,则选择软件压缩代替,视频抓取卡通常还具有将视频信号与VGA信号叠加的能力,这样视频信号可以通过普通显示器显示出来。

还有一种视频设备是电视调谐器,它可以把电视和计算机连在一起。

另一种视频设备是纯播放MPEG节目的解压缩卡。

视频抓取是一个将视频信号数字化并记录到一个文件上的过程。在记录时,视频变成了一系列的图像或者帧,以一定格式存储到磁盘上。在抓取视频帧的同时可以录制声音,也可以只录制视频图像,到编辑时再将同步声音加入到视频序列中。如果视频抓取卡和驱动程序支持叠加视频信号,则在记录时利用视频显示器可以看到活动视频。

视频抓取硬件可以是单独的卡或者是连到现有显示卡的外接模块。视频抓取硬件必提供以下所列的至少一种输入能力:①组合视频(Compositevideo),②S-Video,3RGB视频,④数字视频。

ISA总线的MPC本身所配备的内存大小可能会影响视频抓取能力。原因是ISA总线的机器最多只能配16MB内存,而目前常见的视频抓取卡都将卡上帧缓冲区映射到系统内存区,这些卡要求在16MB内存区内有1MB到2MB内存地址空间供它们使用,根据这一要求,系统所安装的内存就不能超过14MB或15MB。

视霸卡(Video Blaster)是由新加坡创新公司推出的视频抓取卡,目前它有以下三种型号:Video Blaster SE100,Video Blaster FS200和Video Blaster RT300。Video Blaster SE100具有视频叠加(Video Overlay)和视频抓取能力,可以通过视频摄像机在显示器上实时显示视频中抓取单个帧,并以不同格式保存起来,或者将实时视频序列保存为AVI文件。抓取单帧可以支持JPEG、PCX、TIFF、BMP、GIF等文件格式。借助SE100的视频叠加能力,可以完成视频和图形叠加。其技术标准规范如下:

①视频采集

支持NTSC、NTSC-433、PAL、PAL-M、PAL-N、SECAM制式

可以从两路组合视频和一路S-Video输入中选择视频源

②窗口和叠加能力

具有单个像素为边界的窗口定位和改变窗口大小的能力

色彩键选择颜色

③I/O和内存地址

软件可选择I/O地址

软件可选择的帧缓冲基地址

硬件跳线选择中断向量

④图像获取

支持JPEG、PCX、TIFF、BMP、MMP、GIF和TGA文件格式

SVGA上显示分辨率可达800×600×256

可显示16.7百万种真彩色

⑤图像处理

实时图像压缩和播放

冻结、保存和加载视频图像

支持改变图像大小、抖动、淡入淡出和Crop

支持色度、饱和度、亮度和对比度控制

⑥输出

在Windows环境下直接可以输出到打印机

利用D-15连接头输出到显示器

在Video Blaster SE100产品包里还带有以下几个图像处理和编辑软件:

Asymetrix Digital公司的Video Producer

Aldus公司的Photostyler

HSC的Digital Morph

Video Blaster FS200可以将来自摄像机、录像机和视盘机等多种来源的视频图像引入计算机中。它集抓取、压缩和回放于一体,提供全活动视频控制能力。Video Blaster FS200将图像序列从最初大小放大成微机全屏幕的多媒体图像。综合使用Video Blaster FS200和Sound Blaster系列产品可以制作出高质量的多媒体演示产品。

Video Blaster RT300是高性能的视频抓取卡。它采用了Intel高性能的i750视频处理器,能以每秒30帧的速度,320×240的窗口抓取视频。因为它支持视频实时硬件压缩,视频抓取和压缩在一步内完成。视频回放根据计算机性能而变化且回放的帧速率可被调整以产生最佳的输出效果。Video Blaster RT300的另一个突出优点是可以升级为只需要通过普通电话线便可以进入远距离的桌面视频会议。

4.在PC机上播放电影节目

用VCD播放电影节目是近来多媒体市场的一个热点,而其核心则是MPEG解压缩卡。如果不采用有效的压缩算法,全屏实时活动视频要求的存储空间将是相当巨大的。

MPEG卡和VCD的基本原理、特点和几种常用MPEG卡的功能特点。

目前市面上推出的MPEG卡基本上只能放MPEG节目,通常支持MPEG-1标准,可以直接在计算机显示器上放出图像并有立体声输出端口,支持显示分辨率最高达到1024×768,有些MPEG卡还突破只支持VGA模式全屏播放的限制,通过内置NTSC和PAL制式转换器,将视频直接输出到电视机上播放出来,目前流行的MPEG卡有以下几种:

REELMAGICLITE、VIDEOBLASTERMP400、MPX-3、MP020、PANAVIDEO解压卡等。

不管哪一种MPEG卡,其基本标准规范都包括以下几方面:

(1)视频播放

MPEG视频标准,是否与MPEG-1标准兼容

支持的帧速率,NTSC(24fps)或者PAL(30fps)

视频显示,标准VGA输出或者电视输出

(2)音频输出

MPEG音频标准

音频播放能力,如16位立体声

采样率,通常为32KHz、44.1KHz和48KHz

(3)系统接口

总线接口,如标准ISA 总线

视频接口,如VGA 回路、电视组合视频(NTSC/PAL)

音频接口,立体声耳机

(4)支持软件

DOS和MS-Windows MCI接口

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈