首页 理论教育 地观测传感网信息服务的模型与方法-SWE通用数据模型

地观测传感网信息服务的模型与方法-SWE通用数据模型

时间:2023-10-04 理论教育 版权反馈
【摘要】:图2-9 自适应观测数据服务系统信息模型1.SWE通用数据模型 SWE通用数据模型是用一种以自我描述、语义激活的方式来定义和封装传感器及其观测的底层数据。目前最新的SWE通用数据模型编码标准V2.0是对原来被包含在Sensor ML标准 中的SWE通用数据模型V1.0的升级,它于2011年1月4日已经被独立列为OGCSWE框架下的信息模型标准之一 。

地观测传感网信息服务的模型与方法-SWE通用数据模型

在基于虚拟传感网的自适应观测数据服务系统中,数据包含: 传感器描述信息、原始观测值和产品信息。SODS在实现中主要用到了以下四个标准的信息模型和编码规范: 地理标志语言(GML)(Portele,2007),传感器建模语言(Sensor ML)(Botts,2007),观测和度量编码规范(O&M)(Cox,2006)和变换器模型语言(TML)(Havens,2007)。其相互关系如图2-9所示。

图2-9 自适应观测数据服务系统信息模型

1.SWE通用数据模型 (SWE Common Data Model)

SWE通用数据模型是用一种以自我描述、语义激活的方式来定义和封装传感器及其观测的底层数据。更准确地说,SWE通用数据模型用来定义传感器及其观测相关数据的表达、本质、结构和编码。该模型的主要目的是实现传感网互操作,首先可以在语法层面上,之后在语义层面上,使得传感器及其观测数据可以更好地被机器理解,在复杂的工作流程中可以被自动处理,在智能传感器网络节点之间也可以被轻松分享。目前最新的SWE通用数据模型编码标准V2.0是对原来被包含在Sensor ML标准 (OGC 07-000) 中的SWE通用数据模型V1.0的升级,它于2011年1月4日已经被独立列为OGCSWE框架下的信息模型标准之一 (OGC08-094r1)。SWE通用数据模型具有以下特点:

一致性: 为传感器属性,传感器输入、输出值、参数,观测值提供统一支持;

灵活性: 支持内联或外引操作,支持二进制和ASCII编码,支持压缩;

强健性: 对于每个数据元素,可以描述其数据类型、语义、标记和描述、计量单位、约束、质量以及扩展信息;

高效性: 允许ASCII和二进制数据块,以及外部文件或数据流。

SWE通用数据模型除了用于描述动态生成的数据集、数据子集、处理和网络服务输入输出和实时流数据外,主要旨在描述静态数据 (文件)。其中传感器观测数据的类别范围可以从简单现场温度数据到航空飞机流式输出的卫星图像和全运动视频。

基于XML表达的SWE通用数据模型的作用是它可以应用于其他OGC SWE标准中,例如传感器模型语言 (Sensor ML)、传感器观测服务 (SOS)、传感器警告服务 (SAS)、传感器规划服务 (SPS) 以及观测与测量标准 (O&M)。SWE通用数据模型以一个统一的、可互操作的方式用来定义任意数据字段和数据集合,它支持各种各样的数据类型,例如数量、个数、布尔、类别、时间以及集合类型 (如数据记录、阵列、矢量矩阵)。SWE通用数据模型具有强健的XML描述、高效的封装和分析原始数据的能力。

SWE通用数据模型中包含了以下数据类型,如表2-2所示:

表2-2 SWE通用数据类型

2. 传感器模型语言 (Sensor Model Language,Sensor ML)

1998年,在国际对地观测卫星委员会 (CEOS) 的组织下,Mike Botts博士开始研究传感器模型语言——Sensor ML (Sensor Model Language),该研究得到了NASA AIST计划的资助,并于2000年,Sensor ML被引入OGC,成为后来发展传感网信息服务 (SWE) 框架的助推剂。Sensor ML标准一直得到更新与扩展,其中2007年的Sensor ML1.0.1为目前最新版本。

Sensor ML是SWE框架的信息模型之一,它基于XML编码,提供XML标准模式来描述传感器,包括传感器系统的几何、动态以及观测特征值、以及传感器指派任务的参数,用于发现,检索、控制基于网络分布式的传感器。它还用来定义与观测测量及测量后相关的处理,例如空间转换、观测数据地理定位及其他处理等。无论是动态还是静态平台的传感器,原位还是遥感的传感器,它们都能通过Sensor ML来描述。从简单的视觉温度计到复杂的电子显微镜和地球观测卫星,它们都能够通过简单过程和复合过程来表达。

Sensor ML在实际的应用中具有以下作用:

(1) 电子规格参数表: 作为最基础的应用,Sensor ML可用标准的数字形式提供传感器部件和系统的规格参数表格。

(2) 传感器、传感器系统和过程的发现: 通过Sensor ML,传感器系统或过程能够很容易被理解与发现。它提供了丰富的元数据信息集合,它们能够用于挖掘和发现传感器系统和观测过程。这些元数据包括标识、分类、限制 (如时间、法律、安全)、能力、特征、联系、引用以及输入、输出、参数、系统位置等。

(3) 观测值的世系信息: Sensor ML可对观测值提供一个完整的明确的描述,即它可以详细描述观测值获取的过程——从一个或多个探测器获得数据,到数据处理甚至到分析器解译整个过程。它不仅能提供观测值的可信度,在大多数情况下,通过对过程的一些修改或已知信号源模拟,部分或者整个过程可重现。

(4) 观测值的按需处理: 在Sensor ML中,过程链可以用来描述观测值的地理定位或更高层次的处理,使其能够通过网络被发现与分发,以及不需要传感器或过程的先验知识而被按需执行。解决在不同传感器应用领域内差异的扩大化、数据处理的“烟囱式”系统等问题是Sensor ML的原始动机。Sensor ML实现了将处理分配到网络中任意节点,从传感器到数据中心再到单独用户的掌上电脑,这个过程不需要特定的传感器软件支持。

(5) 任务分派、观测和报警服务的支持: 传感器系统或其模拟的Sensor ML形式描述可以用来挖掘信息以支持传感器观测服务 (SOS)、传感器规划服务 (SPS)、传感器警报服务 (SAS)。Sensor ML建立在公共数据类型之上,它们也被应用于整个OGC传感网实现(SWE) 框架内。

(6) 即插即用、自动配置、自治的传感器网络: Sensor ML促进了即插即用传感器、仿真、过程的发展,使它们可以无缝地加入决策支持系统 (DSS)。支持Sensor ML的传感器和过程有自描述的特点,这也促进了传感器网络自动配置以及自治传感器网络的发展。在这些网络中传感器能够发布供其他传感器订阅和响应的警告和任务。

(7) 传感器参数的归档: 最后,Sensor ML提供了一个关于传感器和过程的基本参数和假设归档的机制。因此,即使是最初任务结束很久之后,这些系统的观测值仍然可以进行重处理和改善。

Sensor ML中所有过程都源自抽象过程 (Abstract Process),而抽象过程本身是源自抽象要素 (Abstract Feature)。所有要素都包含了名称和描述属性,同时,所有过程都包括输入、输出和参数,这三个元素都采用SWE数据类型中任意数据类型 (Any Data),如图2-10所示。

图2-10 Sensor ML公共概念模型中的过程概念模型框架 (OGC,2007)

Sensor ML过程概念模型分为两类: ①物理过程,如原子过程 (Process Model)、系统(System),描述了传感器的时间空间参考、位置和与其相关的接口信息。②非物理过程被认为是逻辑 (纯数学) 运算操作,如部件 (Component)、过程链 (Process Chain)。非物理过程如图2-11左部,右部为物理过程模型。根据过程模型的复杂程度,还可以分为原子过程,如原子过程 (Process Model)、部件 (Component),它们通过过程方法的描述,实现从输入到输出的转换。复合过程,如过程链 (Process Chain)、系统 (System),它是将原子过程链接起来的过程。其中元数据组是各过程模型中公共的元素。

非物理过程 (Non-Physical Process) 可认为是纯计算的过程,是纯数学运算或模拟,描述了输入、输出、参数、方法以及元数据。其中原子过程 (Process Model) 被用来定义为非物理的原子过程,它可以组成更加复杂的过程链。原子过程 (Process Model) 的所有属性都来源于基类过程,并在方法属性中描述一个过程方法 (Process Method)。按照方法定义中指定的执行规范执行,可以实现Sensor ML按需的处理。过程链 (Process Chain) 是基于复合过程模型设计的,它由一系列过程组成,可包含原子过程和其他过程链。除了原子过程 (Process Model) 中所包括的输入,输出,参数,和元数据组元素外,过程链(Process Chain) 还增加了部件引用,用“连接”(Connections) 元素详细说明过程链中处理部件之间的联结。“链接”(Connections) 元素包括一系列“链接”(Link) 对象,它们提供各个处理部分中的资源和目的文件“端口”,其中资源是处理部分或数据部分的输出,目的文件数据部分一般是一个处理的输出或参数,或者过程链本身的输出。

图2-11 物理和非物理过程分类视图 (OGC,2007)

物理过程 (Physical Process) 是指涉及时间和空间的具体的过程,空间时间参考系、物理接口描述很重要,如传感器、传感器系统,取样器、传感器平台等观测过程。其中包括的部件 (Component) 是物理的原子过程,它不能再被分割成更小的子过程。部件可认为是原子过程的物理等价物,但是它包括物理过程中的时空参考框架 (Reference Frame)、位置 (Position) 和接口 (Interface),增加了过程方法 (Process Method) 元素来描述Com-ponent的物理处理。系统 (System) 是一组物理和非物理过程组成的复合的过程,可认为是过程链 (Process Chain) 的物理等价物。系统 (System) 源自物理过程,它继承了参考框架 (Reference Frame)、位置 (Position) 和接口 (Interface) 等元素。与过程链一样,系统分别引用部件 (Components) 和连接 (Connections) 元素,描述一系列过程和过程之间的链接。另外,System通过位置元素可以提供各部件的相对位置。

过程元数据组 (Metadata Group) 提供的五种可选元数据元素来对过程的元数据信息进行描述的,它被所有过程应用。这些元数据描述用以支持传感器资源的发现,过程处理结果的转换与分析,以及帮助人们建立起传感器描述的通用框架。

图2-12 Sensor ML公共概念模型中的元数据组 (OGC,2007)

如图2-12所示,这些元数据组包括一般信息组 (标识符、分类符)、约束 (有效时间、法律约束、安全约束)、属性组 (性能、特征)、引用组 (联系、文档资源) 和历史组。

Sensor ML之所以能描述各种传感器系统及其观测过程,得益于它采用了SWE通用数据类型作为底层数据描述格式。Sensor ML系统中几乎所有的属性以及输入输出数据和参数的描述主要涉及以下SWE通用数据类型,包括:

(1) 原始数据类型,补充GML中实现的数据类型;

(2) 通用目的的聚合数据类型,包括记录 (records)、阵列 (arrays)、向量 (vec-tors) 和矩阵 (matrices);

(3) 特殊语义的复合数据类型,包括位置 (position)、曲线 (curve) 和时间聚合类型 (time-aggregates);

(4) 为原始和复合数据类型增加语义、质量指标和约束的标准编码;

(5) 支持语义定义的特殊部件;

(6) XML和非XML阵列编码的表示方法。(www.xing528.com)

3. 观测与量测 (Observations and Measurements,OM)

观测与量测是OGC SWE框架下的信息模型之一,其目标是“定义关于观测与量测术语及其之间的关系,建立通用数据编码模型,提高发现、获取实时和存档数据的能力。”观测与量测规范定义了两大类模型: 观测模型和采样要素模型,它们以用户为出发点,强调语义的感兴趣要素及其属性。

观测与量测规范中定义的模型来源于可复用对象模型。测量学中,“量测”与“观测”两个概念是有区别的。“观测”在观测与量测标准规范中是通用的概念; 而“量测”被保留为描述结果是数值类型的,作为观测的一类特殊类型。

观测与量测为OGC传感器网络整合架构及其传感器观测服务提供了一个框架和编码规范,为数据共享提供了标准基础。OM采用XML模式描述了统一标准的传感器观测数据,消除了异构传感器观测数据格式的差异性。它可以实现不同传感器观测数据标准化描述,考虑了传感器观测对象及其属性、观测时间及地理位置变化、观测过程及其结果的通用性,提供了传感器观测数据发现所需要的信息,包括传感器观测数据的观测时间、位置、过程的描述,并提供了观测数据结果值编码规范,结合 SWE通用数据编码体系框架,使异构传感器观测结果能够在网络环境中发现、访问、处理、共享。OM模型是一种通用的自解析的数据模型。用户不必使用特定的开发类库,就可以实现数据发现、访问、共享,减少了数据之间的操作难度,提高数据的可利用率。OM模型告诉用户如何解析数据,获取数据。OM数据模型包含:

(1) 自身结构的描述: 数据编码格式的描述。只要知道数据模型的结构描述,那么就可以清晰分析出该模型包含的数据信息,提取数据。

(2) 数据的描述: 用于描述数据的内容、空间范围、质量、管理方式、数据的所有者、数据的提供方式等有关的元数据信息。

(3) 数据体本身: 用户感兴趣要素的观测属性的结果值。

OM在实际应用中具有以下作用:

(1) 传感器观测和量测结果的发现: 通过OM描述的观测与量测过程及结果能够很容易被理解与发现。它提供了丰富的观测元数据信息集合,它们能够用于挖掘和发现观测与量测过程和结果。这些元数据包括观测属性、观测手段、感兴趣要素、现象时间以及结果时间等。

(2) 观测值的来源信息: OM信息模型可以链接到Sensor ML传感器观测过程模型,因此它对观测值提供一个完整的明确的描述,即它可以详细描述观测值得到的过程: 从一个或多个探测器获得数据,到数据处理甚至到分析器解译这样的过程。

(3) 多源异构观测数据的标准化: 通过定义一套标准化的观测与量测描述框架,采用SWE通用数据类型实现对任何数据进行统一编码。

(4) 支持传感网观测服务: 由于消除了异构传感器观测数据格式的差异性,基于OGC传感网观测服务,实现观测数据的统一发布、注册与发现。

(5) 观测与量测事件及其结果的归档: 最后,OM提供了一个以标准的数字形式对观测与量测事件、基本参数以及数据结果归档的机制。因此,即使是该观测与量测事件最初任务结束很久之后,其涉及事件过程、参数与数据仍然可以重新分析。

在观测与量测规范中,观测 (observation) 定义为一个描述现象结果的动作事件,通过观测过程 (procedure) 观测感兴趣要素 (featureOfInterest) 的属性,即观测属性 (ob-served Property),产生结果 (result)。其中结果可以是任何类型。在OM中,采用SWE通用数据模型来对结果进行编码,可以是quantities、categories、temporal、geometry values、coverages及其聚合数据类型。

采样要素模型是对观测模型的补充,引入了采样策略,是观测的中间组件,关联于观测模型的感兴趣要素。当用户无法进行直接观测或者只能观测到对象其他属性时,利用采样要素进行观测,然后通过算法、处理链获取最终结果,或者根据领域知识及采样要素与感兴趣要素关系推算出结果。

在观测与量测规范中,观测模型都源自observation,而observation定义为一个描述现象结果的动作事件。所有观测都包括感兴趣要素、观测属性、观测过程和结果,并在此基础上可以扩展元素。观测概念模型如图2-13所示:

图2-13 OM观测概念模型 (OGC,2010)

所有观测模型包含4个关键属性: observedProperty、featureOfInterest、procedure、re-sult。此外还包括可扩展属性: parameter、phenomenonTime、resultTime、resultQuality。

当进行观测时,观测的要素属性可能不是最终的观测属性。在这样的情况之下,我们把该要素作为感兴趣要素的一部分,通过采样概念,关联到最终感兴趣对象的观测属性。

观测模型与采样要素模型之间的关系: 采样要素模型引入采样策略,采样要素是观测的中间组件,关联于观测模型的感兴趣要素。采样要素模型是对观测模型的补充。

当无法进行直接观测或者只能观测对象其他属性时,利用采样概念,通过采样进行观测,然后通过算法、处理链获取最终结果,或者根据领域知识及采样要素与感兴趣要素关系推算出结果。

有以下几种情况,需要采用采样要素模型:

观测特性不是最终感兴趣的特性。当进行观测时,观测结果值依赖于其他观测结果,也就是说观测现象不是目标现象,需要通过算法或处理链获取最终感兴趣要素的结果值。初始观测感兴趣要素必须是关联于目标要素属性。

最大相似要素 (proximate feature)。由于某些原因,有些时候某些领域中要素无法直接观测获取。在这种情况之下,获取最大相似要素,根据这两者关系及采样策略,转换为最终观测要素。

某些环境中,这两种情况共存: ①域要素的直接观测是不切实际的; ②只能观测关联于观测要素的一个属性。

基于采样要素的观测模型,获取要素属性值的过程是间接的。一般是通过基本参数,如相似观测属性,算法或处理链,来获取最终感兴趣要素。在某些情况下,基于域要素的采样要素之间的关系,将近似要素的属性值转换为最终感兴趣要素的属性。采样要素与相关联观测通过感兴趣要素匹配,相关联观测属性observedProperty与采样要素相对应的。采样概念模型如图2-14所示:

图2-14 OM采样概念模型 (OGC,2010)

基本采样要素模型包含以下几个公共元素: sampled Feature、related Observation、re-lated Sampling Feature、survey Details。

O&M信息模型除了可以表达任何传感器观测数据相关信息外,还可以描述观测结果的数据结构和编码部分。O&M概念模型引入了SWE通用数据模型 (SWE Common Data Model),SWE通用数据标准目前作为一个独立的标准规范,它是OM信息模型能形式化表达传感器观测数据的支撑。O&M由数据结构和编码部分构成。

数据结构包含简单数据类型和聚合数据类型。简单数据类型: 数值 (Quantity)、计数 (Count)、布尔型 (Boolean)、类别 (Category) 和时间 (Time) 等。聚合数据类型:数据记录 (Data Record),简单数据记录 (Simple Data Record),数据阵列 (Data Array),矢量 (Vector),条件值 (Conditional Value),曲线 (Curve) 等。

数据值通过各种编码方式进行封装,如文本块 (Text Block)、二进制块 (Binary-Block)、XML链接或通过MIME-type定义。

4. 事件模式标记语言 (Event Pattern Markup Language,EML)

事件模式标记语言 (EML) (OGC 08-132) 是OGC于2008年至今正在讨论的规范。EML是基于XML语法为基础的建模语言,它用来描述事件和事件处理模式,从而进行复合事件处理和事件流处理。EML引入事件,事件流,事件云的概念,将事件处理分为简单模式,复杂模式,时间模式,重复性模式。通过这种事件处理,得到更高等级的事件,并将原始事件储存到因果向量里。EML避免了简单、浅层意义的事件处理,融入了深层次,高效,便捷的事件处理,并在传感器事件服务 (SES) 中对于事件过滤等级三起到了重要作用。

EML定义了四种事件模式,其概念模型如图2-15所示,分别是简单事件处理模式(Simple Pattern),复合事件处理模式 (Complex Pattern),定时事件处理模式 (Timer Pat-tern) 以及重复事件处理模式 (Repetitive Pattern)。这四种事件处理模式丰富了SES的事件过滤能力,从而能从简单的事件得到更高等级的事件,帮助用户主动按需获取感兴趣区域数据,辅助用户做出科学,合理,高效的决策。简单模式是对单个事件处理,简单事件处理还能用在事件过滤等级二中并能派生出如平均值、最大值。复杂模式处理两个事件流,因此带有复合事件处理的能力,复杂事件处理模式的输入通常是其他处理模式的处理结果。值得注意的是,只有简单事件处理模式才能连接到外部事件流。除此之外,重复模式能选出所有的满足查询规则的事件。定时模式用来选择指定/依赖时间点/段的事件。

EML里的每个模式定义了选择函数,视图,Guards。这可以被比作标准的SQL查询语句“Select* from* where* ”。选择函数明确定义了一种事件处理模式的结果是如何算出来的 (如平均值,最大值),这可以进一步用在复杂事件处理和用户向SES预订的输入实例中。视图是这个模式的From部分,它包含了一组事件的子集,比如是最后五分钟产生的事件或最后十个事件。Guards是这个模式里的where部分。在EML中Guards定义了OGC的过滤能力正如SES等级二阐述的那样。Guards过滤适用于任何事件。

EML涉及以下数据结构: 对于简单事件,它主要是通过事件的名称 (Input Name)、属性约束 (Property Restrictions) 进行表达; 复杂事件模式涉及多个简单事件模式 (First-Pattern,Second Pattern)、简单模式间的逻辑操作 (Operator Logical)、逻辑结构 (Operator-Structural) 等数据类型; 定时事件模式主要由时间瞬时点 (Time At) 和时间间隔 (Time-Interval) 进行表达; 重复事件模式则是由事件个数 (Event Count)、模式引用 (Pattern Ref-erence) 以及对于指定事件名称重复选择的数 (Select Function Number) 来表达。

图2-15 EML概念模型

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈