首页 理论教育 GIS空间数据结构-水文现代化与水文新技术

GIS空间数据结构-水文现代化与水文新技术

时间:2023-08-25 理论教育 版权反馈
【摘要】:GIS数据结构主要有两种类型,矢量数据结构和栅格数据结构,空间数据结构的两种类型如图4.33所示,两类数据结构都可用来描述地理实体的点、线、面3种类型。图4.34用线要素表示地理实体的某城市道路路线图若线与结点一起构成网络,则产生线与线之间的连接判别问题,即拓扑关系中的连通性,因此还需要在线的数据结构中建立“指针”指示其连接方向。因此,许多GIS系统都尽可能采用拓扑矢量数据结构。

GIS空间数据结构-水文现代化与水文新技术

GIS的空间数据结构(Spatial Data Structure),是指这种空间数据在系统内的组织和编码形式,也称为图形数据格式,是适合于计算机系统存储、管理和处理地理信息的逻辑结构,是地理实体的空间排列方式和相互关系的抽象描述,是对数据的一种理解和解释。

空间数据编码是指根据一定的数据结构和目标属性特征,将经过审核的地形图、专题地图和遥感影像等资料,转换为适合于计算机识别、存储和处理的代码或编码字符的过程。由于GIS数据量极大,一般需要采用压缩数据编码方式以节省空间。

GIS数据结构主要有两种类型,矢量数据结构和栅格数据结构,空间数据结构的两种类型如图4.33所示,两类数据结构都可用来描述地理实体的点、线、面3种类型。

图4.33 空间数据结构的两种类型

(a)现实世界;(b)栅格表示形式;(c)矢量表示形式

1.矢量数据结构编码的基本内容

矢量数据结构是通过记录坐标的方式,用点、线、面等基本要素尽可能精确地表示各种地理实体。点用空间坐标对表示,线用一串坐标对表示,面为由线形成的闭合多边形。矢量数据表示的坐标空间是连续的,可以精确定义地理实体的任意位置、长度、面积等。

(1)点实体。点实体包括由单独一对(x,y)坐标定位的一切地理或制图实体,如控制点、电线杆、水井等。在矢量数据结构中,除点实体的(x,y)外还应存储其他一些与点实体有关的数据来描述点实体的类型、制图符号和显示要求,如控制点的等级、点名,电线杆的电力通信、高低压,水井的自流或机动等。点实体是空间上不可再分的地理实体,可以是具体的,也可以是抽象的,如地物点、文本位置点或线段网络的结点等,如果点是一个与其他信息无关的符号,则记录时应包括符号类型、大小、方向等有关信息;如果点是文本实体,记录的数据应包括字符大小、字体、排列方式、比例、方向,以及与其他非图形属性的联系方式等信息。对其他类型的点实体也应做相应的处理。

(2)线实体。线实体为一串由两对以上的(x,y)坐标定义的,能反映各类线性特征的直线元素的集合。

线实体通常由n个坐标对组成,主要用于描述连续而复杂的线状地物,如道路、河流、等高线等符号线和多边形边界,通常也称为“弧”和“链”,包括内容:①唯一标识码。用来建立系统的排列序号。②线标识码。用来确定该线的类型。③起点、终点。可以用点号或坐标表示。④坐标对序列。确定线的形状,在一定距离内,坐标对越多,则每个小线段越短,且与实体曲线越接近。⑤显示信息。显示时采用的文本或符号,如线的虚实、粗细等。⑥其他非几何属性。

图4.34 用线要素表示地理实体的某城市道路路线

若线与结点一起构成网络,则产生线与线之间的连接判别问题,即拓扑关系中的连通性,因此还需要在线的数据结构中建立“指针”指示其连接方向。除此以外,在结点上还应记录有交汇线的夹角,这样才能建立起正确的网络。连通性关系对于网络中路径搜寻,如最佳路径计算和全网络流程分析都是非常重要的。图4.34是用线要素表示地理实体的某城市道路路线图,现要选择一条从A1到达A2最优行车路线。从图中可得出A1到A2的多条路线:如A1—b—d—g—i—A2,A1—b—d—e—f—i—A2,A1—b—c—d—g—i—A2,A1—b—d—e—f—i—A2,A1—b—d—g—f—i—A2,A1—b—c—e—f—i—A2,根据道路具体条件,选定最优路径。

(3)面实体。对于面实体,常采用闭合多边形的概念,它是描述地理空间信息的最重要的一类数据,行政区、土地类型、植被分布等具有名称属性和分类属性的地理实体均可用闭合多边来表示。用于GIS的多种专题制图都必须处理闭合多边形问题。

研究多边形数据结构的目的是描述它的拓扑特征,如形状、相邻关系、层次结构等。闭合多边形数据结构的构造方法对多边形的要求如下:①组成地图的每一个闭合多边形应有唯一的形状、周长和面积。任何规则街区也不能设想它们具有完全一样的形状和大小。②地理分析要求的数据结构应能够记录每一个闭合多边形的邻域关系。③专题图上的闭合多边形并不都是同一等级的多边形,而可能是多边形内联套一些多边形(次级,也称“洞”),例如湖泊的水涯线与土地利用图上各多边形同级,而湖中的岛屿则为“洞”。闭合多边形矢量编码方法很多,常用的是拓扑结构法,所谓拓扑结构是指确定各地理实体关系的数学模型。为了准确描述空间目标的位置和空间关系,在涉及空间目标的角度、方向、距离和面积时,应以几何坐标为基础运用解析几何方法来分析;在涉及空间目标之间的相邻、相连、包容、里面、外面等关系时,则采用拓扑几何的方法来解决。拓扑结构数据模型的用途之一就是在进行空间分析时可基于空间关系而不必使用坐标数据,许多空间分析,如综合分析或连通性分析都是很费时的运算,只有使用拓扑数据,才能提高计算速度。如果不用拓扑数据,可能会由于计算时间过长而不能容忍。因此,许多GIS系统都尽可能采用拓扑矢量数据结构。图4.35是用面要素表示地理实体的多边形结构。

(www.xing528.com)

图4.35 用面要素表示地理实体的多边形结构

2.栅格数据结构编码的基本内容

栅格数据是最简单、最直观的一种空间数据结构,它将地面划分为均匀的网格,每个网格作为一个像元,像元的位置由所在行、列号确定,像元所含有的代码表示其属性类型或仅是与其属性记录相联系的指针。在栅格结构中,一个点(如房屋)由单个像元表达,一条线(如道路)由具有相同取值的一组线状像元表达,一个面状地物(如池塘)由若干行和列组成的一片具有相同取值的像元表达。

栅格数据的编码方法有多种,常见的有栅格矩阵法、行程编码、块码和四叉树编码等。其中四叉树编码是一种更有效的压缩数据的方法。

四叉树编码又称为四分树、四元树编码,它把2n×2n像元组成的阵列当作树的根结点,树的高度为n级(最多为n级)。四叉树编码结构如图4.36所示。每个结点有分别代表西北、东北、西南、东南4个象限的4个分支,如图4.36(a)。4个分支中要么是树叶,要么是树叉,如图4.36(b)。树叶用方框表示,它说明该1/4范围或全属多边形范围(黑色)或全不属多边形范围(在多边形以外,空心四方块),因此不再划分这些分枝。树叉用圆圈表示,它说明该1/4范围内,部分在多边形内,部分在多边形外,因而继续划分,直到变成树叶为止。四叉树编码正是按照这一原则划分,逐步分解为包含单一类型的方形区域,其最小的方形区域为一个栅格像元。图像区域划分的原则是将区域分为大小相同的象限,而每一个象限又可根据一定规则判断是否继续等分为次一层的4个象限。其终止判据是,不管是哪一层的象限,只要划分到仅代表一种地物或符合既定要求的几种地物时则不再继续划分,否则一直分到单个栅格像元为止。

四叉树编码优点有:①容易且有效地计算多边形的数量特征;②阵列各部分分辨率是可变的,边界复杂部分四叉树较高即分级多,分辨率也高,而不需表示的细节部分则分级少,分辨率低。因而既可精确表示图形结构,又可减少存储量;③栅格到四叉树及四叉树到简单栅格结构的转换比其他压缩方法容易;④多边形中嵌套不同类型的小多边形表示较方便。四叉树编码的最大缺点是,树状表示的变换不具有稳定性,相同形状和大小的多边形可能得出不同四叉树结构,故不利于形状分析和模式识别

3.矢量数据结构与栅格数据结构的区别

图4.36 四叉树编码结构

(a)分支象限图;(b)树叶、树叉象限图

(1)矢量数据结构。矢量数据结构优点是数据结构严密,数据量小,精度较高,用网络连接法能完整地描述拓扑关系,图形输出精确美观,能实现图形数据和属性数据的恢复、更新、综合。缺点是数据结构复杂,矢量多边形地图或多边形网很难用叠置方法与栅格图进行组合,显示和绘图费用高,特别是高质量绘图、彩色绘图和晕线图等,技术复杂,数学模拟比较困难,多边形内的空间分析不容易实现。

(2)栅格数据结构。栅格数据结构的优点是数据结构简单,空间数据的叠置和组合十分容易、方便,数学模拟方便,容易进行各类空间分析,技术开发费用低。缺点是图形数据量大,用大像元减少数据量时,可识别的现象结构将损失大量信息,图形输出不精美,难以建立网络连接关系,投影变换耗时多。

从上述比较中可以了解到栅格数据结构和矢量数据结构的适用范围。对于一个与遥感相结合的地理信息系统来说,栅格数据结构是必不可少的,因为遥感影像是以像元为单位的,可以直接将原始数据或经处理的影像数据纳入栅格数据结构的GIS。而对地图数字化、拓扑建立、矢量绘图来说,矢量数据结构又是必不可少的。目前,大多数GIS都支持矢量和栅格两种方式,以充分利用两种数据结构的优点。

4.GIS的数据库建设

GIS数据库建立的过程包括技术设计、资料准备、空间数据获取和数据库平台(数据入库)等内容。技术设计是数据采集前重要的准备工作,主要是制定相应的技术标准、操作技术规程、数据分类编码规则及数据质量控制体系。GIS数据库建库的基本过程如图4.37所示。

图4.37 GIS数据库建库的基本过程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈