地理空间数据具有数据量大、种类繁多、处理模型多样等特点,具体如下:
(1) 数据量大、数据种类繁多。单以卫星为例,每天观测地球的卫星成百上千,如美国的NASA和NOAA控制的卫星,还有欧洲、中国、日本和印度等国卫星。这些卫星每天获取和需要处理的数据是TB级的。同时,数据类型来源多样,如有Landsat、SPOT、IKONOS、Quick Bird、AVHRR、EOS和ALOS等。数据格式也多样,如ASCII、HDF、PICT和TIFF/Geo TIFF等。
(2) 有很多处理模型和方法。由于数据来源、数据格式和数据应用多样,数据处理模型和方法多样。即使是相同的数据,也出现这种情况。例如,算植被状况指数就有很多: 归一化植被指数 (NDVI)、均值植被状况指数 (MVCI)、比值植被指数 (RPNDVI)和植被状况指数 (VCI) 等。
(3) 处理的要求越来越高,应用越来越广泛。这是因为处理越来越广泛地应用到社会各个领域。
(4) 单机版处理和基于网络的处理同时存在。单机版处理只能应用在本地环境。基于网络的处理能够联合多网络服务器协同处理。单机版的处理是有限的,受限于物理存储和中央处理器的计算能力,是物理的瓶颈。基于网络的处理可以处理分布式的高性能处理。
面对这些特点,以及如何满足日益增长的需求。地理数据处理面临以下的问题:
(1) 一些处理通过网络进行调用、操作、访问和管理很困难。由于历史原因,由于很多数据和处理都是基于本地或局域网的,这些资源很难通过网络访问获取,同时,由于大量数据分布在不同的地方,调用面临分布式计算和高性能计算问题。
(2) 一些处理不易共享和理解。这是因为很多处理只是遵循国家标准、组织标准或本地标准,而这些标准并没有得到广泛的认可。
(3) 一些处理不够柔性,扩展性差。由于很多处理是依据特定模型或者针对特定领域,利用这类处理来处理不同来源、不同格式的数据,不同的模型和方法都会很困难。(www.xing528.com)
(4) 一些处理的处理性能不高,处理能力有限。由于数据量大,计算性能往往不能满足要求或者延时太长,不能满足实时或者近实时任务。
要解决这些问题,处理系统必须是基于网络的、与国际标准相兼容的、可扩展的、高性能的处理。Web服务技术,OGC WPS技术和云计算技术给我们新的思考方式和实现方法。
Web服务技术是一个设计用于支持网络上机器间互操作的软件系统。它拥有一个机器可处理格式的接口。其他的系统与之交互时使用SOAP消息机制通过典型的HTTP协议和XML系列化等网络标准交互。Web服务是自描述、可重用和高轻便的。它的主要优点:容易构造、快速、低成本、安全和可靠。Web服务技术已大量地运用在生活和科学研究的很多方面。
云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。云计算具有网络尺度的计算、服务面向的计算和高性能的计算等特点 (Stanoevska-Slabeva等,2010; Markus Klems等,2012) 云服务一般分为三个层次: 基础设施即服务,平台即服务和软件即服务。由于云计算的成功使用,出现了众多的云环境软件框架,Apache Hadoop就是其中的一种,它通过简单编程模型实现大规模数据分布式处理。
OGC开发了一系列地理信息共享与互操作服务,其中WPS是关注处理的服务。WPS软件已经被开发和应用。52N WPS是一个很好的开源WPS框架。它使用插件的方式实现处理和数据编码。52N WPS主要部署在单服务器上。Deegree WPS支持1.0.0版WPS规范。它通过配置文件来插入处理,同时整合了一些流行的地理处理框架,如Sextante (ht-tp: //www.sextantegis.com/)、 FME ( http: //www.safe.com/fme/fme-technology/) 和GRASS (http: //grass.fbk.eu/) 等。Deegree WPS也是主要部署在单服务器上。
这些WPS框架主要部署在单服务器上。然而,面对复杂的任务和分布式地处理,单服务器的处理能力是远远不够的。虽然一些WPS整合高性能方法得到实现,如网格计算、分布式计算和平行计算等,但WPS整合云计算的方法没有得到评估。目前流行的云环境有: Amazon弹性云、谷歌App Engine和微软的Azure平台。然而,这些云环境都是收费的,而且不是开源的。Apache Hadoop是一个开源的构造云环境的框架,已得到IBM、Yahoo和Facebook等多家大型企业成功应用。构建一个开源的整合了云环境的WPS将是一个有意义的工作。
综上所述,云环境下WPS的实现是一种解决上面问题的方案。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。