模拟电视信号数字化使电视节目摄录、制作、播出、传输、接收各环节都有巨大变化,也使广播电视、通信、计算机融合,信息形式不再是简单的声音、图像、图形,而是多种格式和媒体的组合,都用同一种符号“0”和“1”表示。
1.A/D转换
A/D转换是将模拟信号转变为数字信号的过程,可以用模数转换器来实现,模数转换器即A/D转换器,或简称ADC,通常的模数转换器是将一个输入的模拟信号转换为一个输出的数字信号的电路,如图2-1所示。
图2-1 A/D转换器
模拟信号的数字化过程主要是取样、量化和编码三个步骤。模拟信号数字化框图如图2-2所示,其中,fc为滤波器的截止频率,fs为取样频率。
图2-2 模拟信号数字化框图
模拟信号的数字化三步骤示例如图2-3所示。
图2-3 模拟信号的数字化三步骤
取样——将时间上连续的模拟信号转变为时间离散的信号,即时间离散化。
量化——将幅度连续的信号转换为幅度离散的信号,即幅度离散化。
编码——按照一定的规律,将时间和幅度上离散的信号用对应的二进制或多进制代码表示。
2.视频信号的数字化
对彩色电视信号的数字化处理主要有分量数字编码和复合数字编码两种方式。复合数字编码是将彩色全电视信号直接进行数字化,编码成PCM形式(已被淘汰)。分量数字编码方式是对亮度信号Y和两个色差信号B-Y、R-Y分别进行PCM编码。
分量数字编码优点:
A.避免了复合数字编码时因反复解码所引起的质量损伤和器件的浪费,且编码几乎与电视制式无关—世界统一的数字编码标准;
B.后期制作的处理方便;
C.时分复用方式,不会像复合数字编码那样因频分复用带来亮、色串扰,可获得高质量的图像;
D.亮度信号和色度信号的带宽根据需要取值不同。
(1)数字分量系统中的亮度和色差信号
电视摄像机拾取得到的原始信号是红(R)、绿(G)、蓝(B)信号,但是在传送时,将其转换为亮度信号Y和色差信号R-Y和B-Y。
由R、G、B到Y、R-Y、B-Y的变换公式如下:
Y=0.299R+0.587G+0.114B
R-Y=0.701R-0.587G-0.114B
B-Y=-0.299R-0.587G+0.886B
彩条信号R、G、B到色差信号的变换到Y、R-Y、B-Y的变换如图2-4所示。
图2-4 RGB到Y(R-Y)(B-Y)的变换过程
由图2-4可见,Y的动态范围在0~700mV之间,同步信号为-300mV,B-Y的数值动态范围在±620mV之间,R-Y的数值动态范围在±491mV之间。
在分量视频中,通过对色差信号R-Y、B-Y引入压缩系数,以把色差分量信号动态范围控制在±350mV之内,再引入350mV偏置,把信号的数值动态范围控制在0~700mV之间。
(2)取样结构
对于一个彩色平面活动图像来说,图像中任一点的亮度C是光波长λ、水平位置x、垂直位置y和时间t的函数。
通过对波长λ积分以后得到的电视信号是x、y、t三者的函数。
摄像机获得的图像信号的过程可以看作是对彩色平面活动图像在时间域和空间域垂直方向上的取样结果。
取样结构是指取样点在空间与时间上的相对位置,有正交结构和行交叉结构等。在数字电视中一般采用正交结构,如图2-5(a)所示。这种结构在图像平面上沿水平方向取样点等间隔排列,沿垂直方向取样点上下对齐排列,这样有利于帧内和帧间的信号处理。行交叉结构如图2-5(b)所示,每行内的取样点数为整数加半个。
图2-5 取样结构图
为了保证取样结构是正交的,要求行周期TH必须是取样周期Ts的整数倍,也即取样频率fs应等于行频fH的整数倍,即
fs=n·fH
(3)亮度信号取样频率的选择
在数字电视中亮度信号取样频率的选择应该从以下四个方面考虑。
a.首先应该满足取样定理,即取样频率应该大于视频带宽的两倍,设亮度信号带宽fu是6MHz,因此有fs≥2fu=12MHz;
b.为了保证取样结构是正交的,取样频率应该是行频fH的整数倍,即
fs=n·fH
c.为了便于节目的国际交流,亮度信号取样频率的选择还必须兼顾国际上不同的扫描格式。现行的扫描格式主要有625行/50场和525行/59.94场两种,它们的行频分别为15625Hz和15734.265Hz,这两个行频的最小公倍数是2.25MHz,也就是说取样频率应是2.25MHz的整数倍,即
fs=m·2.25MHz(15625/15734.265)
其中m为整数。
d.由于编码后的比特率Rb=fs·n,其中n为量化比特数,因此从降低码率考虑,fs选得越接近2fu越好。
在CCIR 601建议中,取m=6,则亮度信号取样频率为:fs=13.5MHz。
(4)色度取样格式
在数字电视中两个色差信号一般用U和V来表示,由于色差信号的带宽比亮度信号窄,所以在数字分量编码时两个色差信号的取样频率可以低一些,同时考虑到取样点正交结构的要求,在数字电视中有以下几种取样格式:
a.4∶2∶2格式
在4∶2∶2格式中,色差信号U和V的取样频率均为亮度信号取样频率的一半,即
fU∶fV=(1/2)·fY=6.75MHz
因此,亮度取样频率和两个色差信号的取样频率之比是
fY∶fU∶fV=4∶2∶2
4∶2∶2编码方式主要应用于电视演播室节目制作中。
b.4∶4∶4格式
在4∶4∶4格式中,色差信号U和V的取样频率与亮度信号取样频率相同,即
fY=fU=fV=13.5MHz
因此,亮度取样频率和两个色差信号的取样频率之比是
fY∶fU∶fV=4∶4∶4
这种方式一般用在对R、G、B信号进行数字化的场合,或在要求高质量的信号源的情况下采用这种格式。
c.4∶1∶1格式
在4∶1∶1格式中,色差信号U和V的取样频率均为亮度信号取样频率的四分之一,即
fU=fV=(1/4)·fY=3.375MHz
因此,亮度取样频率和两个色差信号的取样频率之比是
fY∶fU∶fV=4∶1∶1
d.4∶2∶0格式
4∶2∶0格式中,色差信号U和V在水平方向和垂直方向上的取样点数均为Y的一半,一行按4∶2∶2取样,另一行按4∶0∶0取样,因此称为4∶2∶0格式。
4∶2∶0格式中,四个像素产生六个样值(Y为4个,U和V各一个),如果每个样值8比特编码,6×8=48bits,48/4=12bits/per pixel,即平均每个像素12bits。
以上四种色度取样格式中亮度信号和色差信号的位置如图2-6所示。
图2-6 四种色度取样格式中亮度信号和色差信号的位置
(5)不压缩时码率的计算(www.xing528.com)
码率=一帧图像样点数×每样点比特数×每秒帧数(25Hz);一帧图像样点数=每行有效样点数×一帧图像有效行数;
对DVD图像格式计算如下:
a.对Y信号计算
一行样点数=采样频率/行频=13.5MHz/15.625kHz=864
一行有效样点数=864×η=864×0.83=720(η为水平回扫率,即表示去掉行消隐后的有效样点)
一帧有效行数=625-50=575(即表示去掉消隐后的有效行数,取576)
一帧图像样点数=720×576=414720
Y信号速率(码率)为720×576×8bit×25Hz=82.944Mbit/s。
b.对U、V信号计算
若按Y∶U∶V=4∶2∶2抽样,U、V信号的速率计算如下:
U信号速率为
360×576×8bit×25Hz=41.472Mbit/s
V信号速率为
360×576×8bit×25Hz=41.472Mbit/s
合计为165.9 Mbit/s。
这种方法算出的数据速率不包括行、场消隐期间的样点数据。如按MPEG-2 ML@MP标准压缩后的速率为8.448 Mbit/s,则压缩比约为20∶1,大大节省了码率。
3.音频信号的数字化
声音和图像都是模拟信号,其振幅具有随时间连续变化的特性。对模拟音频信号进行处理、存储和传送都会引入噪声和信号失真,并且随着复制次数的增加产生噪声积累,信号质量会越来越差。声音信号与视频信号在波形上最大的差别在于视频信号是单极性的,而音频信号是双极性的。
对于人耳听觉来说,声音用三个要素来描述,即响度、音调和音色。
a.响度
响度描述的是声音的响亮程度,表示人耳对声音的主观感受,响度和声波的震动幅度有关,响度的大小决定于发声体振动的振幅,一般来说,声波震动幅度越大响度越大,但是响度也与音频频率有关,其计量单位是宋,定义1kHz、声压级为40dB纯音的响度为1宋。
b.音调
声音频率的高低叫作音调(Pitch),表示人的听觉分辨一个声音的调子高低的程度。音调主要由声音的频率决定,同时也与声音强度有关。对一定强度的纯音,音调随频率的升降而升降;对一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音调却随强度增加而上升。
c.音色
音色(musical quality)是指声音的感觉特性,是人耳对各种频率、各种强度的声波的综合反应。不同的发声体由于材料、结构不同,发出声音的音色也就不同,这样就可以通过音色的不同去分辨不同的发声体。音色是声音的特色,根据不同的音色,即使在同一音高和同一声音强度的情况下,也能区分出是不同乐器或人发出的。
音频信号的数字化是指将模拟音频信号变换为数字音频信号的过程,又称为A/D转换,即将时间上连续变化的音频信号进行取样、量化、编码变换成二进制编码的数字信号。
数字音频信号具有动态范围大、复制不走样、抗干扰能力强、可远距离传输、可实施多路复用传输、可实现远程监控和可方便地融入网络传输系统等优点。
音频信号的数字化包括对电视系统中伴音信号和数字音频广播中声音信号的数字化。
(1)音频信号的取样
音频信号的取样是把时间连续变化的信号波形变为时间离散的信号,但由于声音信号的带宽、动态范围及信噪比的要求等与图像信号相比有很大的区别,所以声音信号的取样频率标准及量化电平数均与图像信号不同。另外,对于电视伴音,由于在与视频单通道传输时采用了解时分复用方式,在选择声音的取样频率参数时,还应考虑与图像信号的扫描行频、场频及取样频率的关系。
音频信号取样过程也必须遵循奈奎斯特取样定理的条件,取样频率必须大于或等于原模拟信号频谱中最高频率的两倍,即
fs≥2fm,其中音频信号的上限频率为fm
演播室内的高保真音频信号取为20kHz,传输用或普通音频信号则取为15kHz。为了防止取样频谱混叠,取样前同样采用前置低通滤波器,把过高的频率及杂波滤除。考虑到低通滤波器的过渡特性,通常选取样频率为:
fs=(2.1~2.5)fm
在复合全电视信号直接编码方式中,为了满足声音与图像时分复用,应选择声音取样频率为行频的整数倍,早期当用磁带录像机来记录数字音频时,规定每场312.5行(625行/50场扫描标准)中,用294行记录数字音频数据,而且每行记三个样值,所以得出:294×3×50=44.1kHz,成为音频取样频率标准。
这也同时满足fs=(2.1-2.5)fm的要求,这里fm取为20kHz。
在分量编码方式中,亮度信号取样频率为13.5 kHz,而且13.5kHz=3×4.5kHz,即与各种电视制式的行频成整倍数关系,可选音频取样频率为:
fs=13.5kHz÷3÷375×4=48kHz
也同样满足fs=(2.1-2.5)fm之条件,而且与32kHz取样频率之间有简单的换算关系:
48kHz×2÷3=32kHz
(2)音频信号的量化
取样把模拟信号变成了时间上离散的脉冲信号,但脉冲的幅度仍然是连续的,还必须离散化了才能最终用数字编码来表示。量化就是使模拟信号取样值的幅度以一定单位进行度量,将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。
在音频数字化中,为了提高音质,避免产生喘息现象,一般使用均匀量化方式。由于人耳对于音频幅度变换非常敏感,所以高保真的数字音频设备对音频的量化等级一般为16位(16bit)的均匀量化,高质量的音频信号采用24bit均匀量化。
数字声音信源参数如表2-1所示。
表2-1 数字声音信源参数
(3)音频信号的编码
模拟音频信号经过取样、量化后还不便于存储和传输,还需要把它转换成某种数字编码表示,这一过程就是编码。
音频工程学会(AES)规定,在专业数字设备中,应使用2的补码编码方式。2的补码是将偏移二进制码的最高位求反得到的码。偏移二进制码则是将最低电平作为0,而编码规律与自然二进制码相同。
(4)演播室数字音频声道
GY/T156-2000标准对2路记录的声道分配、4路记录的声道分配和8轨声音记录格式作了规定,分配情况如表2-2所示。
表2-2 多路声音轨记录的声道分配
a.NTSC-RGB型
在Macintosh计算机上显示NTSC图像,其像素结构为640×480,其数据率为:
数据率=水平分辨率×垂直分辨率×颜色深度/8
640×480×24/8=921600B=921.6kb,
921.6kb×30帧/秒=27.6Mb/s
从上可以看出,其比特率为27.6Mb/s,即1s所需存储容量为27.6Mb。
b.PAL-RGB型
PAL的像素结构为768×576,其数据率为:
数据率=水平分辨率×垂直分辨率×颜色深度/8
768×576×24/8=1327104B=1327.1kb
1327.1KB×25帧/秒=33.2MB/s
显然,PAL制式下数字视频的传输率及所需存储容量比NTSC制式高。
c.ITU-R BT.601数字分量信号NTSC
在ITU-R BT.601的标准中,当数字视频信号选用4∶2∶2格式,亮度信号Y的分辨率为720×486样值,色度信号U和V的分辨率为360×486样值,设每个样值8bit编码,则一帧画面的数据量为:
720×486+360×486×2=699840≈700(kb)
700kb/帧×30帧/秒=21MB/s
从上看出,数字分量型Y、U、V的数据率及所需的存储容量比R、G、B分量型明显减少,其原因是对U、V进行了模拟压缩。
同理,可以计算出数字音频信号的比特率。对32kHz、44.1kHz、48kHz三种取样频率,按16bit量化,比特率分别为:
32×16=512(KB/s)
44.1×16=705.6(KB/s)
48×16=768(KB/s)
此结果为单声道情况,当双声道(立体声)时比特率要增加一倍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。