首页 理论教育 数字音频与视频基本概念

数字音频与视频基本概念

时间:2023-11-07 理论教育 版权反馈
【摘要】:声波的振幅通常是指音量,它是声波波形的高低幅度,表示声音信号的强弱程度。在MPC中,采样频率的标准定为11.25 kHz、22.05 kHz、44.1 kHz。数字量的二进制位数是量化精度。按照处理方式的不同,视频分为模拟视频和数字视频。2)模拟视频长时间存放后视频质量会降低,而数字视频便于长时间存放。4)数字视频数据量大,在存储与传输的过程中必须进行压缩编码。随着数字视频的应用范围不断发展,它的功效也越来越明显。

数字音频与视频基本概念

1.声音

(1)声音的基本概念。

声音是人类进行交流和认识自然的主要媒体形式。从本质上说,声音是通过一定介质(如空气、水等)传播的一种连续的波,在物理学中称为声波。声音的强弱体现在声波的振幅上,音调的高低体现在声波的周期或频率上。

声波是随时间连续变化的模拟量,它有以下三个重要指标。

1)振幅。声波的振幅通常是指音量,它是声波波形的高低幅度,表示声音信号的强弱程度。

2)周期。声音信号的周期是指两个相邻声波之间的时间长度,即重复出现的时间间隔,以秒为单位。

3)频率。声音信号的频率是指信号每秒钟变化的次数,即周期的倒数,以赫兹(Hz)为单位。

声音质量是用声音信号的频率范围来衡量的。一般而言,声源的频带越宽,表现力越好,层次越丰富。

(2)声音的数字化。

声音是一种具有一定的振幅和频率且随时间变化的声波,通过话筒等转化装置可将其变成相应的电信号,但这种电信号是一种模拟信号,不能由计算机直接处理,必须先对其进行数字化,即将模拟声音信号经过模/数转换器变换成计算机能处理的数字声音信号,然后利用计算机进行存储、编辑或处理。在数字声音回放时,由数/模转换器将数字声音信号转换为实际的声波信号,经放大后由扬声器播出。

把模拟声音信号转变为数字声音信号的过程称为声音的数字化,它是通过对声音信号进行采样、量化和编码来实现的。

1)采样。采样是指以固定的时间间隔(采样周期)抽取模拟信号的幅度值。采样后得到的是离散的声音振幅样本序列,仍是模拟量。采样频率越高,声音的保真度越好,但采样获得的数据量也越大。在MPC中,采样频率的标准定为11.25 kHz、22.05 kHz、44.1 kHz。

2)量化。量化是将采样得到的信号幅度的样本值从模拟量转换成数字量。数字量的二进制位数是量化精度。在MPC中,量化精度的标准定为8位、16位。

采样和量化过程称为模/数转换。

3)编码。编码是指把数字化声音信息按一定数据格式表示。

(3)音频文件的格式。

音频数据都以文件的形式保存在计算机中。音频的文件格式主要有WAV、MP3、WMA等,专业数字音乐工作者多使用非压缩的WAV格式进行操作,而普通用户更乐于接受压缩率高、文件容量相对较小的MP3或WMA格式。

1)WAV格式:WAV格式是Microsoft和IBM共同开发的PC标准声音格式。由于没有采用压缩算法,因此,无论进行多少次修改和剪辑都不会失真,而且处理速度也相对较快。

2)MP3格式:MP3(MPEG Audio Laver 3)文件格式是用一种按MPEG标准的音频压缩技术制作的数字音频文件。它是一种有损压缩,通过记录未压缩的数字音频文件的音高、音色和音量信息,在它们的变化相对不大时,用同一信息替代,并且用一定的算法对原始的声音文件进行代码替换处理,这样就可以将原始数字音频文件压缩得很小,可得到11∶1的压缩比。

3)CD格式:CD格式音频文件的扩展名为.cda。标准CD格式的采样频率为44.1 kHz,量化位数为16 bit,速率为176 KB/s,CD音轨是近似无损的,因此它的声音基本保真度高。

4)WMA格式:WMA(Windows Media Audio)格式是Windows Media格式中的一个子集,而Windows Media格式是Microsoft Windows Media技术使用的格式,包括音频、视频或脚本数据文件,可用于创作、存储、编辑、分发、流式处理或播放基于时间线的内容。

2.视频(www.xing528.com)

(1)视频的分类。

按照处理方式的不同,视频分为模拟视频和数字视频。模拟视频是指每一帧图像是实时获取的自然景物的真实图像信号。我们在日常生活中看到的电视电影都属于模拟视频的范畴;数字视频是基于数字技术以及其他更为拓展的图像显示标准的视频信息,它与模拟视频相比有以下特点:

1)数字视频可以不失真地进行无数次复制,而模拟视频信号每转录一次,就会有一次误差积累,产生信号失真。

2)模拟视频长时间存放后视频质量会降低,而数字视频便于长时间存放。

3)可以对数字视频进行非线性编辑,并可增加特技效果等。

4)数字视频数据量大,在存储与传输的过程中必须进行压缩编码。

随着数字视频的应用范围不断发展,它的功效也越来越明显。

(2)视频压缩标准。

视频数据的编码和压缩是以声音与图像的编码和压缩为基础的,主要采用的是MPEG系列标准。目前推出了专门支持多媒体信息基于内容检索的编码方案MPEG-7,以及多媒体框架标准MPEG-21。

由ITU-T和MPEG联合开发的新标准H.264是最新的视频编码算法。为了降低码率,获得尽可能好的图像质量,H.264标准吸取了MPEG-4的长处,克服了以前标准的弱点,具有更高的压缩比、更好的信道适应性,必将在数字视频的通信和存储领域得到越来越广泛的应用。

(3)视频文件的格式。

视频格式可以分为适合本地播放的本地影像视频格式和适合在网络中播放的网络流媒体影像视频格式两大类。

1)本地影像视频格式。

①AVI格式:即音频视频交错(Audio Video Interleaved)格式。AVI格式允许视频和音频交错在一起同步播放,一般用于保存电影、电视等各种影像信息,有时它也出现于Internet中,主要用于让用户欣赏新影片的精彩片段。

②MPEG/MPG/DAT格式:MPEG是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台共同支持。同时,图像和音响的质量也非常好,并且在微机上有统一的标准格式,兼容性相当好。

2)网络视频格式。

①RM格式:它是Real Networks公司所制定的音频/视频压缩规范Real Media中的一种。RealPlayer能利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播。

②MOV格式:QuickTime是Apple公司用于Mac计算机的一种图像视频处理软件。它提供了两种标准图像和数字视频格式,即可以支持静态的PIC和JPG图像格式,动态的基于Indeo Video压缩算法的MOV和基于MPEG压缩算法的MPG视频格式。

③ASF格式:ASF(Advanced Streaming Format,高级流格式)是Microsoft公司为了和RealPlayer竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了MPEG-4压缩算法,压缩率和图像的质量都很不错。

④WMV格式:WMV的英文全称为Windows Media Video,是一种独立编码在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准。WMV的主要优点在于可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈