数字内容处理技术包括音视频编/解码、版权保护、内容虚拟呈现等多项技术,实现了数字内容的集成与分发,支持具有版权保护的、基于各类消费终端的多种消费模式,为公众提供综合、互动的内容服务。
1)可伸缩编/解码技术
为了适应传输网络异构、传输带宽波动、噪声信道、显示终端不同、服务需求并发和服务质量要求多样等问题,以“在无须考虑网络结构和接入设备的情况下灵活使用或增值多媒体资源”为主要目标的可伸缩编/解码技术的研究应运而生。
从2003年起,国际MPEG组织的SVC小组开始致力于可伸缩视频编/解码技术的研究、评估以及相关标准的制定。2003年7月,该小组对9个系统提案进行了专家级的主观测试比较,其中基于小波技术的系统提案就有6个,并且都实现了空间、时间及质量的完全可伸缩性,到2006年形成国际标准草案。此后,可伸缩视频编/解码体系的相关技术处于不断完善,推陈出新的创新时期。
2)音视频编/解码技术
国际上音视频编/解码标准主要有两大系列:ISO/IEC JTC1制订的MPEG系列标准;ITU针对多媒体通信制订的H.26x系列视频编码标准和G.7系列音频编码标准。
MPEG-2标准主要用于高清电视和VCD/DVD领域,促进了数字媒体业务的迅猛发展。此后,MPEG制订了一系列多媒体视音频压缩编码、传输、框架标准,包括MPEG-4、H.264/AVC(由ITU与MPEG联合发布)、MPEG-7、MPEG-21。以MPEG-4、H.264/AVC为代表的新一代编码处理技术,提供了更高的压缩效率,综合考虑了互联网的带宽随机变化性、时延不确定性等因素,引入新的网络协议和技术,在VOD流媒体服务中有了飞跃发展,从而成为面向互联网多媒体业务应用的主流。
我国具有自主知识产权的AVS音视频编解码标准工作组所推出的视频技术,在H.264/AVC技术的基础上,形成简化复杂度和一定效率的算法工具集,目前在卫星直播和高清光盘应用中已进入试验阶段。
针对以上格式的解码技术,目前基本停留在学术研究阶段。全面、系统地实现MPEG-2、MPEG-4、H.264/AVC之间的解码还未进入实用阶段。研究用于音视频等主流数字媒体内容格式和编码的实用化的解码技术,为用户提供丰富多彩的节目源,并根据网络带宽变化和终端设备的处理能力提供最佳的视听服务,从而促进数字媒体服务业的良性发展。
3)内容条目技术
国际上,为了方便广电行业各个单位之间的媒体资产交换,SMPTE制订了完善的元数据模式(编目标准),称为DCMI(Dublin Core Metadata Initiative,都柏林核心元数据倡议)。
元数据的分类和属性的标准化是非常重要的环节,英国广播公司(BBC)给自己的制作和后期制作步骤制订了一套元数据系统并命名为标准媒体交换格式(Standard Media Exchange Format,SMEF)。SMEF元数据模型包含142个实体和500个属性用来描述实体。BBC把SMEF方案提交给EBU组织,作为欧洲地区的广播技术标准。
我国的电视节目编目主要是以国家标准为参考(如《广播电视节目资料分类法》等),采用多种标准并存模式。有以内容性质、专业领域、节目体裁、节目组合方式为标准的分类,也有以传播对象的职业、年龄和性别特征为标准的分类。例如,以内容为标准,分为新闻类节目、社教类节目、文艺性节目和服务性节目;以内容涉及的专业领域,分为经济节目、卫生节目、军事节目和体育节目;以节目体裁,分为消息、专题、访谈、晚会和竞赛节目等;以节目组合形式,分为单一型节目、综合型节目、杂志型节目等;甚至以传播对象的社会特征为标准,可将节目简单地划分为少儿节目、妇女节目和老年人节目,或者工人节目、农民节目等。国家主管部门也研究了全国广播电视系统多家电台、电视台、音像资料馆现行的音像编目标准,同时借鉴了国内外目前通行的节目分类编目法,本着实用性、简单性、灵活性、可扩展性的原则,将DC元数据概念引入对节目或素材的描述中,但由于兼容性等问题目前并没有得到广泛推广和应用。
随着数字媒体内容在网络环境中的广泛传播,各类不同类型、不同风格、不同粒度(素材/片段/样片/成品等)、不同格式的海量数字媒体内容冲击着传统的广电媒体传播途径,造成了媒体内容管理与检索的混乱与困境。研究基于精细粒度元数据表示的数字内容分类与编目索引体系,以适应各类不同类型的数字媒体内容的管理与检索,成为数字媒体内容管理的一项紧迫任务。
4)内容聚合技术
内容聚合以Web 2.0的RSS为代表,Web 2.0的RSS内容聚合技术的主要功能是订阅博客和新闻。各博客网站和新闻网站对站点上的每个新内容生成一个摘要,并以RSS文件(RSS Feed)的方式发布。用户需要搜集自己感兴趣的各种RSS Feed,利用软件工具阅读这些RSS Feed中的内容。Web 2.0的RSS内容聚合技术的缺点是功能有限,目前主要支持文本内容的聚合,对推送的信息没有进行语义关联,并且没有利用用户的个性对推送的信息进行过滤。
个性化服务系统追踪用户的兴趣与行为,利用用户描述文件来刻画用户的特征,通过信息过滤实现主动向用户推荐信息的目的。系统要求用户注册一部分基本信息,并且隐式地收集用户信息。系统允许用户自主修改用户描述文件中的部分信息,还通过分析以隐式方式收集的用户信息自适应地修改用户描述文件。根据学习的信息源,用户跟踪的方法可分为两种:显式跟踪和隐式跟踪。显式跟踪是指系统要求用户对推荐的资源进行反馈和评价,从而达到学习的目的;隐式跟踪不要求用户提供任何信息,跟踪由系统自动完成。隐式跟踪又可分为行为跟踪和日志挖掘。
数字内容的聚合是通过对各类数字媒体内容深层主题信息的检测、挖掘与标注,并利用各类媒体主题语义关联链接,形成丰富的多媒体内容综合摘要,通过用户行为分析、内容过滤为用户定制和推送所关注的和感兴趣的与主题相关的丰富多彩的数字媒体内容信息服务,是未来数字网络互动娱乐服务社区的发展趋势。
目前,在文字、语音、视频内容识别与信息抽取、自动摘要等方面都有一些较为成熟的技术,但尚未完全形成数字内容聚合的概念。
5)数字版权保护技术(www.xing528.com)
媒体内容产业的数字化为内容盗版与侵权使用带来了便利,版权问题正成为制约数字媒体内容产业发展的瓶颈之一。盗版问题需要依靠技术、行业协定及国家法规协同解决,而数字媒体版权保护与管理技术在“内容创建—内容分发—内容消费”整个价值链中实现数字化管理,同时为行业协定及国家法规的实施提供技术保障。
数字权利管理共性技术包括数字对象标识、权利描述语言和内容及权利许可的格式封装,这是数字权利管理系统互操作性的基础。数字版权管理(Digital Rights Management,DRM)技术已经发展到第二代。第一代DRM技术侧重于对内容加密,限制非法复制和传播,确保只有付费用户能够使用,第二代DRM技术在权限管理方面有了较大的拓展。除了加密、密钥管理以外,DRM系统还包括授权策略定义和管理、授权协议管理、风险管理等功能。
目前,国家音视频标准的DRM工作组正结合国家音视频编码格式制订版权保护的共性技术标准。数字权利管理涉及安全领域的基础性技术包括媒体加密技术和媒体水印技术,针对具体的媒体对象可进行相应优化。媒体水印技术虽然尚未成熟,但已经投入商用,用于提供媒体认证及增值服务,特别是P2P内容分发技术,国外新近推出的产品纷纷采用脆弱性水印技术、识别非授权媒体及追踪盗版。我国一些高校在媒体加密和水印方面有一定的研究基础并拥有技术商业化的能力。
6)数字媒体隐藏技术
数字媒体资源是社会发展的重要战略资源之一。国际上围绕数字媒体资源的获取、使用和控制的竞争越演越烈,致使数字媒体安全问题成为世界性的问题。数字媒体资源是维护国家安全和社会稳定的一个焦点,以及亟待解决、影响国家大局和长远利益的重大关键问题。数字媒体安全主要包括数字媒体系统的安全和数字媒体内容的安全。由于密码加密方式存在容易被破解或密钥丢失等问题,数字媒体隐藏技术作为新兴的数字媒体安全技术受到人们越来越多的关注。
数字媒体隐藏是利用人类感觉器官的不敏感,以及多媒体数字信号本身存在的冗余,将秘密信息隐藏在一个宿主信号中,不被人的感知系统察觉或不被注意到,而且不影响宿主信号的感觉效果和使用价值。目前,数字媒体隐藏的研究和应用主要有隐写术(Steganography)和数字水印(Digital Watermarking)。
隐写术是隐蔽通信内容及其秘密通信存在事实的一门科学和技术。它与密码术分属于不同的学科,有着本质的区别:密码术是将信息的语义变为看不懂的乱码,攻击者得到乱码信息后,已经知道有秘密信息存在,只是不知道秘密信息的含义,没有密钥难以破译信息的内容。隐写术是将秘密信息本身的存在性隐藏起来,攻击者得到表面的掩护信息,但并不知道有秘密信息存在和秘密通信发生,因而降低了秘密信息被攻击和破译的可能性。
数字水印是将一些标识信息(即数字水印)直接嵌入数字载体中或通过修改特定区域的结构间接表示,且不影响原载体的使用价值,也不容易被探知和再次修改,但可以被生产方识别和辨认。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是保护信息安全、实现防伪溯源、版权保护的有效办法,是信息隐藏技术研究领域的重要分支和研究方向。
数字水印与隐写术的不同在于数字水印中的载体信息是被保护的信息,它可以是任何一种数字媒体,如数字图像、声音、视频或电子文档。数字水印一般需要具有较强的健壮性。隐写术中的载体只是掩护信息,其中隐藏的信息才是真正重要的信息。
7)数字媒体取证技术
随着数字媒体技术的不断发展,功能强大的编辑、处理、合成软件随之出现,对数字媒体数据进行编辑、修改、合成等操作变得越来越简单,使得网络、电视、报纸、杂志等传播媒体上出现了大量具有真实感的计算机编辑、篡改、伪造或合成的多媒体数据。这些经过篡改、伪造的数据变得越来越逼真,以致在视觉和听觉上与真实的数据难以区分。一旦把这些伪造的数据用于司法取证、媒体报道、科学发现、金融、保险等方面,将对社会、经济、军事、政治、文化等造成非常严重的影响。数字媒体取证正是针对这些危害而提出的,主要用于对数字媒体数据的真实性、原始性、完整性和可靠性等进行验证,对维护社会的公平、公正、安全和稳定有着非常重要的战略意义。
数字媒体取证根据取证方式分为主动取证和被动取证。其中,主动取证包括数字媒体签名和水印技术,是利用数字媒体中的冗余信息随机地嵌入版权信息,通过判断签名和水印信息的完整性实现主动取证。被动取证是指在没有嵌入签名或水印的前提下,对数字媒体进行取证。尽管多数篡改、伪造的数字媒体不会引起人们听觉上的怀疑,但不可避免地会引起统计特征上的变化。数字媒体的被动取证是通过检测这些统计特性的变化来判断多媒体的真实性、原始性、完整性和可靠性。与主动取证相比,被动取证对数字媒体自身没有特殊要求,待取证、待检测的数字媒体往往未被事先嵌入签名或水印,也没有其他辅助信息可以利用,因此,被动取证是更具现实意义的取证方法,也是更具挑战的课题。数字媒体被动取证主要包括数字媒体篡改取证技术、数字媒体源识别技术和数字媒体隐写分析技术。
8)基于生物特征的身份认证技术
在当今社会中,人们的日常工作与生活都离不开身份识别与认证技术,而数字媒体技术以及网络技术的高速发展更是要求个人的身份信息能够具备数字化和隐性化的特性。如何在网络化环境中安全、高效、可靠地辨识个人身份,是保护信息安全所必须解决的首要问题之一。传统的身份认证方式主要是使用身份标识物(如各类证件、智能卡等标识卡片)和使用身份标识信息(密码和用户名等信息)。身份标识物极易遭伪造或者丢失,身份标识信息也很容易遭泄露或者遗忘。这些问题的产生原因都可归结于身份标识物或者标识信息都无法实现,以及使用者建立唯一关联性和不可分离性。而基于生物特征的身份认证技术,是利用人类固有的生理特征(如指纹、掌纹、人脸、虹膜、静脉等)和行为特征(如步态、声音等)来进行个人身份认证。与传统身份认证技术相比,生物特征具有唯一性、不可否认性、不易伪造、无须记忆、方便使用等优点。基于生物特征的身份认证在一定程度上解决了传统的身份认证中所出现的问题,并逐渐成为目前身份认证的主要手段。
9)大数据技术
现在的社会是一个信息化和数字化的社会,互联网、物联网和云计算技术的迅猛发展,使得数据充斥着整个世界,与此同时,数据也成为一种新的自然资源,亟待人们对其加以合理、高效、充分地利用,使之能够给人们的生活、工作带来更大的效益和价值。随着数据的数量以指数形式递增,以及数据的结构越来越趋于复杂化,赋予了大数据不同于以往普通数据更加深层的内涵。
对于大数据的概念目前来说并没有一个明确的定义。维基百科将大数据定义为:所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理的时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极的资讯。互联网数据中心将大数据定义为:为更经济地从高频率的、大容量的、不同结构和类型的数据中获取价值而设计的新一代架构和技术。人们对大数据存在一个普遍的共识,即大数据的关键是在种类繁多、数量庞大的数据中,快速获取信息。从数据到大数据,不仅仅是数量上的差别,更是数据质量的提升。传统意义上的数据处理方式包括数据挖掘、数据仓库和联机分析处理等;而在大数据时代,数据已经不仅仅是需要分析处理的内容,更重要的是人们需要借助专用的思想和手段从大量看似杂乱、繁复的数据中,收集、整理和分析数据足迹,以支撑社会生活的预测、规划和商业领域的决策支持等。
大数据处理的流程主要包含数据采集、数据处理与集成、数据分析、数据解释4个重要步骤。大数据的关键技术有云计算、MapReduce、分布式文件系统、分布式并行数据库、大数据可视化和大数据挖掘。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。