2.4.3 基于XML技术的信息内容与结构组织
所谓XML(Extensible Markup Language)技术体系,是指以XML语言为代表和基础的一系列信息组织和信息处理技术,该技术是一种基于SGML(标准通用标记语言,ISO8879)的可扩展标记语言,可定义由层级内容元素构成的树形文件逻辑结构,定义由XML声明、文档类型定义(DTD)和XML实例三者组成的文件物理结构,定义内容元素和文献结构的标记语言和语法,从而建立一种独立于任何系统、语言和程序的信息内容与结构定义的交换机制。
在XML基础上,出现了一系列信息组织与处理标准,具体如图2-3所示,这使XML技术体系日益成为全球数字化信息环境中各种信息的定义、组织、处理和交换的核心基础。
图2-3中,XML Schema和XML NameSpace提供文档格式和元素集共享复用机制,其中XML Schema是文件模式定义语言,提供定义和描述文献结构的基本规则和标记工具,支持复杂数据类型和更
图2-3 基于XML的信息组织与处理标准体系图
为丰富的文献内容结构。XML NameSpace通过在XML声明语句中嵌入名称域链接,可复用外部元素集来标记XML文件的元素或属性名称。(www.xing528.com)
XMLInfoSet,XML Fragment,XInclude提供文献内容体系抽象描述组合机制,其中XMLInfoSet为XML文件定义一个树形结构的抽象数据对象集,称为XML文件信息集,可抽象表征和指向XML文件
结构和内容。XML Fragment(XML Fragment Interchange)解决在抽取和传递XML文件片段时如何保存和传递该片段与整个XML文件的位置与关系信息。XInclude(XML inclusion)建立基于文件信息集的合并XML文件的标准方法。
DOM,Xquery和XML Protocol提供对基于XML的信息资源进行处理的机制,其中DOM(Document Object Model)定义一系列与系统平台和程序语言无关的应用编程界面(API),由此可对XML/HTML文件的逻辑结构及内容结点进行操作。Xquery提供XML文件的标准查询语言,对XML文献及其集合以及分布式XML资源进行查询,并为其他数据库提供基于XML的查询界面和集成界面。XML Protocol提供允许多个系统在分布环境中利用XML作为封装语言进行通信或远程调用的技术手段。
RDF和RDFS提供基于XML的元数据描述机制,XHTML,SMIL,SVG,MathML是利用XML语言标记特定数据类型的专门语言。其中,XHTML建立将HTML文件转换为XML文件的标准方法,SMIL(Synchronized Multimedia Integration Language,同步多媒体合成语言)定义,根据演示时序和空间布局,将一组独立的多媒体对象(包括声音、图像、文字、视频图像等)合成为同步多媒体演示的标准方式。SVG(Scalable Vector Graphic)定义用XML语言表述基于矢量图形、点阵图像和文本的二维图像的标准方式。MathML(Mathematical Markup Language)则是基于XML语言的描述数学公式结构和内容的标准方法,支持基于Web的数学信息表达、传递和处理。实际上,不同领域还定义了其他一些基于XML的专门数据标记语言。利用这些及其他XML技术,各类信息内容、信息格式、信息过程和信息系统都成为开放、可互操作、即插即用的信息环境的一部分,保证灵活方便地进行复杂和自动的信息组织处理。
XML Signature,Canonical XML和XML Encryption提供基于XML的安全机制,其中,XML Signature(XML Signature Syntax and Processing)定义利用XML语言建立和表达数字签名的语法和规则。Canonical XML解决将实质上相同但标记上不同的XML文件,转换成物理表示上完全相同的XML文件,从而保证不同标记但内容相同的文献,其数字签名保持一致。XML Encryption希望建立一种加密XML格式,并确定加密时的具体技术要求。
Xpath,Xpointer,Xlink和Xbase提供指向和链接文件或文件片段的机制,其中Xpath定义表达、识别和指向XML文件中任一内容结点的标准路径描述语言,通过结点路径标记来穿巡XML文件层级结构,查找、确认和指向任何结点。Xpointer基于Xpath并予以扩展,定义在URI中嵌入文件结点路径标记的方法,实现指向和链接XML文件内部任何片段的能力。XLink定义在XML文件中建立单向链接、多资源链接、双向链接、内容片段链接以及链接属性和角色等的标准方法。
XSL和XSLT提供XML文件转换和格式单表现机制,其中XSL是XML文件格式单定义语言,可根据输出介质、应用需求和系统要求来建立描述具体显示或打印格式的格式单,支持跨系统的灵活表现。XSLT是XML文件转换方式定义语言,用以定义从一种XML文件中选择指定的内容结点转换为另一种XML文件的转换模板。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。