多媒体技术,是自改革开放以来,国人接触最多的、包括“音乐立体声”、“高保真音视频播放效果”的一项令人激动、给人音视频“震撼效果”的现代化信息播放技术!与通信行业的其他单项技术类似,多媒体通信技术,也正处在“经久不衰,长期发展”的过程中。
20世纪70年代末期,是“电子技术”大行其道的时代。当时,适逢我国改革开放之初,“时髦青年”们戴着“蛤蟆镜”,拎着日本“三洋牌”双卡双声道收录机,播放着邓丽君的歌曲,或是“太阳岛上”之类的时尚歌曲,招摇过市——那种“时髦”的“典型场景”,至今,仍给人留下深刻的印象。还有些“音乐发烧友”们,为了追求高质量的音乐视听效果,自制“多声道功放器”电子电路,形成了多声道(喇叭)的“环绕立体声”功率放大器系统,形成逼真的、震撼的音乐效果,至今,也还是人们津津乐道的话题。
本节首先介绍通用的“多媒体”的概念、种类和表现方式;然后,按照“音频效果”、“静态图像(图片)效果”和“连续视频播放效果”的顺序,由浅入深地介绍“当前多媒体信号的组成与通信”的技术和国际标准,特别是我国自行开发的AVS视频标准。另外,国际上最新推出的“蓝光多媒体播放国际标准”的系统组成和工作原理,也是本节要介绍的特色内容之一。“追寻历史起源,分析实际应用”是本教材坚持的两大特点,在本节也得到充分的体现。
2.4.1 多媒体技术概述
1. 多媒体的概念
能同时提供多种媒体(信道)效果的信息传送系统,称为“多媒体系统”。如多路音响视听系统、可视电话系统、网络电视系统等。而多媒体信息技术则是对信息进行“表达”、“存储”和“传输”处理技术的总称,主要分为两个部分的内容:一是通过计算机技术对信息本身进行制作与处理的过程,即多媒体信息制作技术;二是通过现代通信技术进行传输和表达(播放)的过程,即多媒体通信系统。
多媒体通信技术的特点有三点:其一是依靠和充分应用计算机技术和现代网络通信技术,对信息进行统一格式的数字化、标准化编程,便于存储和反复使用多媒体信息产品——如磁带、CD/VCD/DVD光盘、电脑硬盘中的存储节目和数码相片等;其二是信息量大与表现形式的多种信道的感受,带给人们充分的视听震撼效果;第三是制作与使用过程的实时互动性,可以通过计算机硬盘、网络或多媒体产品,随时随地点播欣赏或使用之,因而,它将逐渐成为现代信息处理与传播表达的主要方式之一,也是组成现代信息社会的基础技术之一。
这里的“媒体”是指信息传递和存取的最基本的技术和手段,而不是指媒体本身。例如,我们日常使用的语音、音乐、报纸、电视、书籍、文件、电话、邮件等都是媒体。
2. 多媒体的种类和特点
根据国际电联(ITU-T)的定义,信息传播的媒体(信道)共分为以下五类。
(1)感觉媒体(Perception Medium)
由人类的感觉器官直接感知的一类媒体。这类媒体有声音、图形、动画、运动图像和文本等。
(2)表示媒体(Representation Medium)
为了能更有效地处理和传输各类信息,而将信息转换形成的一种媒体,也就是用于数字信息通信的各类编码处理技术,如图像编码、文本编码和声音编码以及压缩技术等。
(3)显示媒体(Presentation Medium)
进行信息输入和输出的媒体,如显示屏、打印机、扬声器等输出媒体和键盘、鼠标器、扫描仪、触摸屏等输入媒体。
(4)存储媒体(Storage Medium)
进行信息存储的媒体,有硬盘、光盘、软盘、磁带、RΟM、RAM等。
(5)传输媒体(Transmission Medium)
用于承载信息,将信息进行通信传输的媒体,也就是由通信线缆、无线链路、通信设备等组成的各类通信系统等。
多媒体技术所涉及的“媒体”的含义,在这里特指“表现的方式”,而且主要是指“数字化的信号表现方式”。因此,也可以说,多媒体就是多样化的数字信号的表现方式。
和多媒体概念相对应的是“单媒体”表现方式,以往的信息技术,基本上是以“单媒体”的方式进行的,如有线电话、单声道广播等媒体技术,大多都是如此。人们在获取、处理和交流信息时,最自然的形态就是以多媒体方式进行——往往表现为视觉、听觉甚至嗅觉等感觉器官的并用,共同感知信息的表现效果。单媒体方式只是一种“最简单的”、“初级的”信息交流和处理的方法,而多媒体方式才具备“丰富多彩”的信息表现方式,是人们交流的理想、真实的表达方式。
多媒体信息的通信网络,主要是传统的电话通信网、广播电视网以及日益发展的IP宽带互联网。其传输,主要表现为语音、图形、和视频信息等的传播,表2.3是几种信号传播方式的特征参数。
表2.3 多媒体信号传输的特征参数一览表
多媒体技术不仅使计算机应用更有效,更接近人类习惯的信息交流方式,而且将开拓前所未有的应用领域,使信息空间走向多元化,使人们思想的表达不再局限于顺序的、单调的、狭窄的一个个很小的范围, 而有了一个充分自由的空间,并为这种自由提供了多维化空间的交互能力。总之,多媒体技术将引领信息社会逐渐进入到新一代的信息传播和表达的美好境界。
2.4.2 多媒体通信的关键技术
主要有“信息压缩处理技术”、“有线网络通信技术”、“移动多媒体通信技术”和“多媒体数据库技术”等。
1.多媒体信息源处理(信源编码)技术
目前,在多媒体信息压缩技术中最为关键的就是音/视频压缩编码技术。一般来说,多媒体信息的信息量大,特别是视频信息,在不压缩的条件下,其传送速率可在140Mb/s左右,至于高清晰度电视(HDTV)可高达1000 Mb/s。为了节约带宽,让更多的多媒体信息在网络上传送,必须对视频信息进行高效的压缩。
经过了20多年的努力,视频压缩技术逐渐成熟, 出现了H.261~ H.264、MPEG-1~4、MPEG-7等一系列音/视频压缩的国际标准。即使是高清晰电视影像节目(HDTV),经过压缩后的传输速率只需20 Mb/s。至于普通的“可视电话”信息,在现有的电话网络(PSTN)上传送时,也可压缩为20 kb/s左右的数码流。语音信号的压缩技术也得到了重大的发展,一路语音信息如不压缩,需要64 kb/s的速率;经过压缩后,可以降到32 kb/s、16 kb/s、8 kb/s甚至移动电话传输的5~6 kb/s。为了提高“通信信道利用率”这个重要的指标,“视频与音频压缩编码”是通信行业十分重视、也是想方设法必须解决的多媒体信源编码技术课题。
2.多媒体通信的宽带网络传送技术
在多媒体通信系统中,网络上传输的是多种媒体综合而成的一种复杂的数字信息流,它不但要求网络对信息具有高速传输能力,还要求网络具有对各种信息的高效综合处理能力。按照目前的通信网络技术看来,以“单模光纤传输技术”和“电信级的IP网络通信技术”为特征的下一代通信网络(NGN)是实现多媒体通信的主要技术手段。
通信技术发展至今,中国的通信行业,以接入网“光纤到户(FTTH)启动元年”为技术特征的现代通信技术,正逐步迈向信息传播的“大容量、高速度”时代,光纤以它“传播速度快、传输距离长、优异的通信特性、稳定的技术特征”的种种技术优势,正成为现代通信传输的主要手段,引领通信系统,稳健地进入到未来的“全光通信网络”的系统中。
在交换技术方面,2006年已逐步展开的以“电信级的IP网络通信技术”为特征的下一代通信交换网络(NGN),已逐步在全国各地开花结果,自上而下的拓展方式,已经形成了“开放式的、灵活调度式的、面向未来的”通信网络新格局。未来的发展方向,应是努力实现“光信号的处理与交换”的新技术。
综上可知,现代通信网络的发展,“从网络硬件”上,已经形成了“大容量传输和交换处理”的整体格局,未来网络的发展,将转向到“发掘各类网络功能应用——物联网的发展”上面来。这是一项“全民参与”的社会化应用工程,相信在不久的将来,会出现越来越多的QQ、淘宝、百度、网上在线健康咨询等各类适合社会大众的应用功能。
3.多媒体通信的终端技术
“多媒体通信终端”是指能集成多种媒体信息,并具有网络交互功能的用户通信终端。它必须完成信息的采集、处理、同步、显现等多种功能,必须具备小型化、可靠、低价的产品,因此“大规模集成电路(VLSI)”和“电子设计自动化(EDA)”技术也是必不可少的。无疑,这些问题的解决,将会推动多媒体通信终端技术的迅速发展。
随着网络应用的逐渐开拓和发展,以各类家庭“在线应用”的网络终端设备,将会越来越受到社会和人们的青睐。表2.4中列出了部分未来热门的“网络终端”产品的种类,供大家参考。
表2.4 未来热门的“网络终端”产品的种类示例表
4.移动多媒体通信技术
由于移动多媒体通信需要信息的无线传输技术的支持, 其关键技术除了上面介绍的三个方面外, 还包括以下三个方面的移动多媒体信息传输技术:
(1)射频技术
从射频技术的角度来看,它的发展不很明显,但新频段的开发和应用却是日新月异的,第三代移动通信系统规定使用2 GHz频段,因此移动接入系统使用的频段要做相应的调整。有些提议移动多媒体通信系统使用2.5 GHz频段和5 GHz频段,但这些频段传播特性不是很好。现在很多机构都在研发17 GHz、19 GHz、30 GHz、40 GHz、60 GHz频段的应用。
(2)多址方式
CDMA是第三代移动通信的代表性多址方式,数据传输速率达到2 Mb/s,能够实现多媒体通信。应当说多址方式可以作为移动多媒体通信的接入方式。
(3)调制方式
要实现移动多媒体通信,就现有的各种调制技术而言,正交频分多路(ΟFDM)技术是最优的选择。这种技术方式不需要特别高的宽带线性功率,也不必担心高功率信号对常规信号功率的影响。ΟFDM的数字信号处理比工作在相应速率的均衡技术简单, 由于载波频率正交,ΟFDM有较好的多路干扰抑制能力。
5.多媒体数据库技术
数据库是指与某实体相关的一个可控制的数据集合, 而数据库管理系统(DBMS)则是由相关数据和一组访问数据库的软件组合而成的,它负责数据库的定义、生成、存储、存取、管理、查询和数据库中信息的表现(Presentation)等。传统的DBMS处理的数据类型主要是字符和数字。传统的数据库管理系统在处理结构化数据、文字和数值信息等方面是很成功的。
多媒体数据库的基本技术主要包括:多媒体数据的建模、数据的压缩/还原技术、存取管理和存取方法、用户界面技术和分布式技术等。为了适应技术的发展和应用的变化,多媒体数据库应该具有开放的体系结构和一定的伸缩性,同时它还需要满足如下要求:具备传统数据库管理系统的能力;具备超大容量存储管理能力;有利于多媒体信息的查询和检索;便于媒体的集成和编辑;具备多媒体的接口和交互功能;能够提供统一的性能管理机制以保证其服务性能等。
2.4.3 多媒体语音编码技术
1.多媒体声音源与数字化
声音按频率可分为次声波(20Hz以下)、可听声波(20~20000Hz)和超声波(20kHz以上)三类,人类说话的声音频率通常在300~3000Hz,这个频率范围之内的信号称为“语音信号”,也是多媒体系统传播的第1类声音信号,通常通过传统的电话通信(手机、固定电话等)系统传输,这类信息通常是不需要存储的即时信号。多媒体系统传播的第2类信号,是各种影视作品,以广播、CD/VCD/DVD光盘以及通信宽带网络等方式传播;表2.5是多媒体声音制品的特征分类表。
表2.5 多媒体业务语音传输特征分类表
语音信号通过“采样、量化、编码”等标准的数字化处理步骤之后,转换为“0、1代码”的数字信号流,第1类电话语言信号经数字化编码后,转换为64kb/s的数字信息流;第2类影视作品,根据信号效果的不同,采样频率分为11.025kHz、22.05kHz和44.1kHz、量化级分别为8位和16位,分为上表中的三级信息传码率;在计算机中,数字语音信号的存储文件主要有wave、mp3、wma和midi四种格式,专业的音乐人士一般喜欢使用无信号压缩的高质量wave格式进行操作,而普通大众则更乐意接受压缩率高、文件容量相对较小的mp3(11倍压缩率)或wma(20倍以上压缩率)格式。
2.多媒体语音编码标准
普通调幅广播质量的音频信号频率范围是50~7000 Hz ,当使用16 kHz 的采样频率和14位数字量化编码时,形成的多媒体语音信号速率为224 kb/s。1988年CCITT(ITU前身)制订了G.722标准,专门负责将该多媒体音频信号转换为64kb/s。
高保真立体声音频信号质量的频率范围是50~20000 Hz ,在44.1kHz的采样频率下用16位数字量化编码时,语音信号速率为 705 kb/s。国际上流行的高保真立体声音频信号采用MPEG-1(即mp3)标准,它提供三种编码速率:第一种384 kb/s,主要用于小型盒式磁带(DCC)模式的数字信号存储;第二种192~256 kb/s,主要适用于数字广播音频、CD/VCD/DVD等信号模式的存储和播放;第三种是64 kb/s速率,主要应用于通信网络上的音频信号的传输。
在计算机上,可以通过相应专用软件对音频信号的格式进行转换,例如,通常使用豪杰公司的“豪杰超级解霸3000”软件中的一个实用工具——MP3格式转换器,进行MP3格式与其他几种格式之间的转换。
另一种十分流行的语音编码模式是“AC-3(Audio Code Number 3)”系统,这是由美国Dolby(杜比)公司推出的高保真立体声音频编码系统, 它采用了指数编码、混合前/后向自适应比特分配及耦合等一系列新技术;测试结果表明,AC-3系统的总体性能要优于MPEG模式,在实际生活中得到广泛的采用。
2.4.4 多媒体静止图像编码技术
多媒体图像/视频信号分为“静止图像”和“动态视频流图像”两大类,下面首先介绍几个与图像有关的概念,然后对静态和动态的视频信号分别予以叙述。
1.与图像有关的几个概念
指“图像像素与分辨率”、“像素的颜色”、“视频与帧速率”、“电视制式”等。
(1)图像像素与图像、系统分辨率
在多媒体图像中,一幅图像是由纵横(XY坐标)2维空间上的图形元素组合而成的,基本的图形组成元素称之为“像素”,一幅图像的总像素数量一般是由“横向像素总数×纵向像素总数”的模式表现出来的,图像的总像素数量即称为“图像分辨率”;除了每一幅多媒体图形具有各自的“分辨率”之外,还有“系统分辨率”的说法,是指图像产生、显示设备所具有的“图形分辨率”;例如,某数码相机对数字照片的表现(产生)能力,也用“相机分辨率”表示,电脑显示器也有“显示分辨率”的指标,常用的电脑显示分辨率模式为320×200、640×480、800×600、1024×768、1280×1024、1600×1200等。
(2)像素的颜色
多媒体像素的颜色指每个像素所使用的颜色的二进制位数,对于彩色图像来说,颜色深度值越大,显示的图像色彩越丰富,画面越逼真、自然,但数据量也随之激增,常用的颜色二进制位数分别是4位、8位、16位、24位和32位,其颜色评价如表2.6所示。
对8位/字节的存储单元而言,一幅图像的存储字节数计算公式如下:(www.xing528.com)
图像的存储字节数=图像分辨率×颜色深度位数/ 8
表2.6 多媒体图像颜色组成与评价表
(3)视频与帧速率
人的眼睛具有“视觉暂留”的生物现象,即被观察的物体消失后,其影像在人眼中仍保留一个非常短(约0.1秒)的时间,利用这一现象,将一系列画面以足够快的速率连续播放,人们就会感觉该移动的画面变成了连续活动的场景,这就是“放电影”的原理;所谓“视频”的概念,也就是指利用人类“视觉暂留”现象的一系列快速连续播放的画面,达到“放电影”的视觉效果这一过程。这里一幅幅单独的画面图像就称为“帧”,单位时间内连续播放的画面速率称为“帧速率”,典型的帧速率为25帧/秒(中国)和30帧/秒(美国、日本等)。
(4)电视制式
所谓“电视制式”,指电视播放的标准,目前的电视播放仍然采用“模拟信号”的方式,常用的电视播放制式如表2.7所示。
表2.7 多媒体电视业务传输特征分类表
2.多媒体静止图像(照片)
多媒体静止图像指针对图像传真、彩色数码照片等“静止的图像”多媒体信息进行产生、存储、和远距离传送通信的处理,主要采用ITU-T联合图像专家组(JPEQ)制订的JPEQ和JPEQ 2000标准压缩模式,该模式是压缩比为25∶1的有损压缩方式,通过“正向离散余弦变换(DCT)”、“最佳DCT系数量化”和“霍夫曼可变字长编码”3个压缩步骤,形成相应的数字信息模式,存储在电脑硬盘或其他存储器中,利用专门的图像编辑软件,非常便于对该图形信号进行编辑、修改和传输。
2.4.5 多媒体运动视频流图像编码技术
运动视频流图像指针对影视作品、IPTV等“动态视频流图像”信息,进行产生、存储、和远距离传送通信的处理,由于其信息量非常大,根据CCITT-601协议,广播质量的数字视频(常规电视)的传码率就达到216Mb/s,而高清晰度电视则在1.2Gb/s以上,如果没有高效率的信号压缩编码技术,是很难传输和存储如此庞大的视频流图像信息的。按照实际的需求和通信质量,视频流图像信号可分为三类:低质量可视电话级、中等质量视频信号级和高清晰度电视信号级,表2.8分三类予以说明。
表2.8 多媒体电视业务质量等级分类表
国际电信联盟制订了一系列的运动视频流图像处理标准,其中最典型的是 H.261、和ITU-T运动图像专家组(MPEG)制订的MPEG-1、2、4等标准压缩模式,下面分别予以说明各自的用途。
1.H.261标准
H.261是CCITT(ITU-T的前身)于1990年12月公布的第1个国际视频流压缩标准,主要用于电视电话和会议电视,以满足当时(1991年)ISDN通信网络的发展需要。其特点是以P×64kb/s(P=1~30)为传输速率,当P=1~2时仅用于可视电话;当P=6~30时支持会议电视系统,可以在电话通信网络中传输。
2.MPEG-1标准
MPEG-1是CCITT于1991年11月公布的关于传码率为1.5Mb/s以下的国际标准(ISΟ/IEC 11172),其设计指标如下。
①在存储媒体上,达到VCD的标准,可以通过CD/VCD等光盘录制信息节目。
②在图像质量方面,帧速率为25帧/秒和30帧/秒;达到普通电视画面的效果。
③在通信方面,采用类似于H.261标准的编码方式,能适应多种通信网络的传输方式,如ISDN电话网和LAN计算机局域网;在传输速率上,为1~1.5Mb/s,以1.2Mb/s为合适,这是当时计算机通信网络的传输速度。
MPEG-1编码系统包括MPEG系统、 MPEG视频和MPEG音频三部分,将压缩后的视频信号、语音信号及其他辅助数据统一“包装”起来:将它们划分为一个个188字节长的分组,以适应不同的传输或存储方式。在每个分组的字头设置时间标志参数,为解码提供“图声同步”的功能;形成便于存储和网络传送的文件格式。
MPEG-1标准的公布,极大地推动了Video-CD(VCD)影视盘的发展,尽管它本身只设计了双声道的音频信号的传播,在当时的环境下,也达到非常“震撼”的豪华视听效果。同时,对影视作品的网络化传播与下载,也开创了技术模式上的先河,其压缩数据能以文件的形式,在视频服务器和电信宽带网络上传送、管理和接收,客户能通过网络点播该类节目,形成了VΟD的效果。
3.MPEG-2标准
MPEG-2是由MPEG工作组于1994年11月推出的国际标准(ISΟ/IEC 13818),是对MPEG-1标准的继承和升级,传码率为10Mb/s,适用于更广泛的多媒体视听领域;以后又对该标准进行了扩展。
MPEG-2编码系统延续了MPEG-1的编码原则,也包括MPEG“系统”、“视频”和“音频”三部分,同时又增加了一个“性能测试”部分。其中,系统模块定义了编码的语句和语法,以实现一个或多个信息源的音视频数据流的形成;视频模块引入了“分级服务质量”的概念,为了适应不同的应用需要,该标准制订了五种不同的档次,每种档次又分为四个质量服务等级,因而具有较强的分级编码能力,其压缩比可变且最高可达200∶1。具体的等级分类应用情况如表2.9所示。
表2.9 MPEG-2视频等级标准与分类应用一览表
音频处理模块,提供了8个声道,包括5个全频段声道,2个环绕立体声声道和1个超重低音声道。真正实现了“家庭影院”和“影视剧场”中高保真环绕立体声的音频“震撼”效果。
MPEG-2的应用领域很广,它不仅支持面向存储媒介的应用,而且还支持各种通信环境下多媒体数字音视频信号的编码和传输,如数字电视、IPTV和DVD(数字视频光盘),以及面向未来的高清晰度电视(HDTV)的应用和普及。为信息化社会的发展,奠定了技术基础。是目前应用较广泛的主流多媒体通信标准。
4.其他多媒体视频标准
(1)H.263标准
是ITU-T为低比特率应用而特定的视频压缩标准。这些应用包括在PSTN(公共电话网)上实现可视电话或会议电视等。
(2)H.264标准
是ITU-T和ISΟ/ICE的MPEG的联合视频组(JVT)开发的标准,也称为MPEG-4 Part 10。 H.264因其更高的压缩比、更好的IP和无线网络信道的适应性,在数字视频通信和存储领域得到越来越广泛的应用。
(3)MPEG-4标准
是为视听数据的编码和交互播放而开发的第2代MPEG标准,于1998年11月公布,是一个全新概念的、使用范围很广的多媒体通信标准。MPEG-4的目标是为多媒体数据压缩提供了—个更为广阔的平台。它更多定义的是一种格式、一种结构系统,而不是具体的算法。MPEG-4的最大创新在于为用户提供具体的、个性化的综合系统业务能力,而不是仅仅使用面向应用的固定标准。此外,MPEG-4将集成尽可能多的数据类型,例如自然的和合成的数据,以实现各种传输媒体都支持的内容交互的表达方法。通过MPEG-4,我们能够建立一个家庭音响合成中心、一个通信网关、或是一个个性化的视听系统。MPEG-4可用于移动通信和公用电话交换网,支持可视电话、视频邮件、电子报纸和其他低数据传输速率场合下的应用。是目前国际主流的多媒体传输应用标准。
在MPEG-4中,采用了发送多媒体综合信息流框架DMIF(Delivery Multimedia Integration Framework)的结构,用来整理一系列的音视频数码流。该结构独立于具体的通信接入网络。对用户而言,DMIF是一个灵活的应用接口,它还需要申请到通信所需的业务质量Qo S(带宽、时延要求等)参数。
MPEG-4的数据流分为两大部分,即与传输网络有关的输出数据流和与各类媒体信道有关的上层数据流,如图2.11所示。
由图2.11可看出:各多媒体音视频数码流经过3个步骤形成统一的信息流,进入通信接入网发接口电路中。首先,各基本视频信息进入“接入单元层”,在此分组打包,形成独立的数码流;然后进入“灵活汇聚复用层”,将各路码流汇聚成1路高速串行数码流,到达“传输复用层”单元;第3步,经过传输复用层的数据适配处理,传入到通信网络中,形成多媒体信息流。
图2.11 MPEG-4数码流DMIF组合框架示意图
(4)MPEG-7多媒体内容描述接口
MPEG-7 的工作于 1996 年启动,名称为:多媒体内容描述接口(Multimedia Content Description Interface),其目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更有效地检索信息。这些媒体“材料”包括静态图像、3D模型、声音、电视及其在多媒体演示中的组合关系。MPEG-7 的应用领域包括:数字图书馆、多媒体目录服务、广播媒体的选择、 多媒体编辑等。
(5)AVS标准
正式名称为《信息技术先进音视频编码》,是由我国推出的,第一个具有自主知识产权的数字音视频编解码技术标准。AVS标准的数字视频编解码技术标准已于2006年2月被公布为中国国家标准,它是我国第一个具有自主知识产权、达到国际先进水平的数字音视频编解码标准,是高清晰度数字电视、高清晰度激光视盘机、网络电视、视频通信等重大音视频应用所共同采用的基础性标准。在编码效率上,AVS比传统的MPEG-2效率高了二至三倍,在计算资源的消耗上降低了30%~50%。尽管如此,AVS还是选择了与MPEG-2系统兼容的道路。主要是因为,MPEG-2已有较长的发展历史,在产业链的上游设备生产环节中形成了一定的规模效应;在下游的接收设备中,其关键芯片也都是遵循MPEG-2标准。短时间内很难扭转这样巨大的产业惯性。因此,为了实现平滑过渡,在设计AVS时,对MPEG-2实行兼容而非取代。
此外,AVS除了技术先进、性能稳定之外,重要的是其拥有完全自主知识产权,在专利费用方面远远比MPEG-4和H.264这两种国际标准要低。
我国AVS标准工作组成立于2002年6月,主要是中国部分研究机构及彩电企业为研发拥有自主知识产权的音视频编解码技术而成立的。AVS这一标准一直得到包括TCL、北京海尔广科、创维、华为、海信、浪潮、长虹、上广电、中兴通讯等通信企业与厂家的大力支持,广电总局也曾表示支持。AVS工作组有“三驾马车”,即负责组织研究制定技术标准的“AVS工作组”、负责知识产权事务的“AVS专利池管理委员会”和负责推动AVS产业应用的“AVS产业联盟”。这三个组织,有力保证了AVS“技术、专利、标准、产品、应用”的协调发展。
AVS国家标准颁布后,我国企业已经相继开发出AVS实时编码器、AVS高清解码芯片、AVS机顶盒、AVS解码软件等产品。中国网通集团采用AVS作为其IPTV的标准。国家广电总局组织的移动多媒体广播国家标准CMMB采用AVS视频国家标准,地面广播数字电视等其他领域的应用也在逐步展开;此外在国际化方面,该组织正加速推进AVS国际化产业化进程。
(6)最新一代多媒体视频标准——蓝光多媒体视频标准
图2.12 蓝光多媒体播放器和光盘示意图
“蓝光音视频传播技术”体制(Blu-ray),或称蓝光盘(Blu-ray Disc,缩写为BD),是利用波长较短(405nm)的“蓝色激光(Blu-ray)”读取和写入数据,并因此而得名。
传统的DVD是用激光器(LD)光头发出的红色激光(波长为650nm),来读取或写入数据的,通常来说,波长越短的激光,能够在单位面积上记录或读取的信息就越多。因此,蓝光光盘的存储容量远远高于普通的现行DVD光盘。该光盘制式是三菱等公司联合提出的“新一代DVD音视频传播”标准。与传统的DVD标准相比,容量提升了数倍,支持25~100G的容量,远大于现在的DVD-9制式的8.4G。包括美国著名的华纳兄弟电影公司(WB)、福克斯电影广播公司(FΟX)等六家世界著名电影制作企业,都表示将会出版“蓝光格式”的电影,蓝光播放器就是为这个准备的。
“蓝光音视频传播技术”制式,是目前世界上最先进的大容量光碟制式,也是一个播放视频的新标准(软件),比DVD画面清晰。可达到1080p画面,影像完全没有“失真”的感觉,而且一些细节也更加清晰,特别在高速动态画面的时候,同样能保持很好的表现,容量也大。目前已经达到令人吃惊的200G。与传统的CD或是DVD存储方式相比,BD光盘显然带来更好的反射率与存储密度,这是其实现容量突破的关键。蓝光产品的巨大存储容量,为高清电影、游戏和大容量数据存储提供可能和方便,将在很大程度上促进高清娱乐的发展。
蓝光制式作为新一代的多媒体播放与传输的标准格式,其根本原因就在于技术的领先和强大的企业生产—销售联盟,同时也就更受消费者青睐。蓝光刻录机系统可以兼容此前出现的各种光盘产品。蓝光光碟还拥有一个异常坚固的表层,来保护光碟里面重要的记录层,可以经受住频繁的使用、指纹、抓痕和污垢,以此保证蓝光产品的存储质量和数据安全。
蓝光播放器能够通过HDMI接口实现采用1920×1080分辨率的蓝光碟片的1080p高清格式输出,并且能够支持包括Mini-SD和MMS短棒在内的多钟记忆卡的读取功能。理论上完全显示将近4.4万亿种颜色。
2.4.6 流媒体通信技术
流媒体(Streaming Media)音视频通信技术,是指通过宽带Internet互联网,提供即时点播影像和声音的新一代多媒体通信技术,最典型的应用就是“视频点播VΟD(Video Οn Demand)”。它近乎实时的交互性和即时性,使其迅速成为一种崭新的多媒体通信传输渠道。
1.流媒体的工作方式
在网络上传输视频、音频等多媒体信息,目前主要采用“下载(Download)”和“流式传输(Streaming)”两种工作方式。
(1)下载方式
是将全部音/视频文件通过网络传输到客户电脑,经保存后,才能开始播放。所以下载方式要考虑对客户端的存储需求和播放时延两个因素;同时受到网络传输带宽(速率)的限制,下载常常要花费数分钟甚至数小时,如像avi、mpg、mp3、wav等格式的“音/视频文件”。
(2)流式传输
是把“音/视频媒体信息”由流媒体服务器通过网络连续、实时传输到客户电脑,在这个过程中,客户不必等到整个文件全部下载完毕,而只需经过几秒或十几秒钟的启动时延即可播放。当音/视频媒体在客户端播放时,其流媒体的余后部分将在后台继续下载。流式传输方式不仅使启动时延成十倍、百倍地缩短,而且不需要太大的缓存容量。在Internet(或Intranet)上使用流式传输技术的连续时基媒体就称为流媒体,通常也将其视频与音频称为“视频流”和“音频流”。显然,流媒体实现的关键技术就是流式传输。
2.流式传输技术
(1)流式传输实现的途径与过程
首先,将音/视频信息数据预处理成流媒体以适应流式传输,同时也适应网络带宽对流媒体的数据流量的要求。预处理主要包括采用先进高效的压缩算法和降低通信质量等。
其次,流式传输的实现需要“缓存装置”, 在Internet上是以“分组交换(信息报)”传输方式为基础,进行断续的异步传输,为此,使用缓存系统来弥补网络传输过程中的延迟和抖动所带来的影响;不会因之出现播放停顿。在用户电脑中,通常使用“系统操作盘(C盘)”的多余存储空间,作为“缓存系统”,所以通常电脑操作系统盘(C盘),应设定较大的多余存储空间,作为流媒体传输之用,保证VΟD即时点播的影视作品的流畅播放,中途不至于中断。
(2)流式传输协议
流式传输的实现,一般采用“HTTP/ TCP”网络协议来传输控制信息,使用RTP/ RTCP/ RTSP协议支持实时传输流媒体数据;用HTTP中的MIME标记和识别流媒体的类型。
流式传输的格式(软件),目前主要有三种:Real-Media、MediaPlayer和ASF格式。使用较多的是前面两种,本身均支持windows操作系统,在个人电脑(PC机)中安装该类软件也较方便。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。