《1 前言》

1 前言

空间查询、检索、空间分析和数据挖掘是提取空间信息的基本方法[1] 。由于地理信息系统(GIS)数据库中表达的现实世界空间实体间存在着相互作用、相互制约的依存关系,因此,如何利用这种空间实体间的关系实现快速、有效地提取信息便是近年来许多学者关注的热点问题[2~4] 。显然,描述和表达空间实体间的关系是研究此问题的基础。

《2 空间关系描述中的“空间”概念》

2 空间关系描述中的“空间”概念

从广义上讲,空间关系是人们认知空间形态的途径,反映人们怎样对空间形态进行推理及怎样用不同的语言来描述空间形态。在GIS中空间关系属于空间信息范畴,它研究的是具有一定位置、形态和属性的单目标之间(即点/点、点/线、点/面、线/线、线/面、面/面之间)或组合目标之间的相互关系。根据不同的几何特性,空间关系可以划分为拓扑关系、度量关系和方向关系。

空间实体在不同的空间有不同的几何特性,因此,对空间对象的定义取决于空间实体所存在的空间的结构。目前用来表达空间实体的空间有4种,即度量空间、欧几里得空间、拓扑空间和集合空间。其中度量空间是用于描述空间实体的可量测的距离。欧几里得空间是用于计算空间实体之间距离和角度的几何空间。和度量空间不同的是,欧几里得空间是用实体的坐标来表示的,而度量空间是直接用距离表示的。拓扑空间是一种用于表达与实体位置和距离无关的数学空间。换句话说,它是描述空间对象在拉伸、收缩、放大等拓扑变换情况下其空间拓扑关系保持不变的一种空间。集合空间主要用于描述实体的集合关系,如集合的成员关系、包含关系、继承关系等。

在上述4种空间中,由于拓扑关系具有与实体位置本身无关的特性,它最适合于矢量数据模型的表示,在空间关系理论研究中探讨得比较多。但是不难发现,上述空间在某种程度上都是严格意义上的数学空间,而GIS中研究的对象主要是地理空间实体,描述的空间关系则是地理空间关系。这种地理空间关系的描述、表达与空间实体的地理空间分布及其所处的地理空间环境(如地形、坡度、坡向等)有关。显然,这在数学空间中较难显示与表达。例如,数学上定义度量空间如下。

定义1:设 S 是一个集合,其元素为点,记作 p1p2p3 等,而且 dS × SR 为满足下列3条性质的非负实数。

条件1:( p1p2) ≥ 0 ;当且 仅当 p1 = p2 时, ( p1p2)= 0 。

条件2:( p1p2)= ( p2p1) 。

条件3:( p1p2) ≤ ( p1p3)+ ( p3p1) 。

S d 构成的整体称为一个度量空间,记为 (,) ;在地理空间中,定义1中的条件2、条件3往往难以成立。另外,根据空间实体的维数和空间本身的维数也可将空间划分为 1 维空间、2 维空间、3 维空间等。在不同维数的空间中,空间实体有不同的几何表达和几何特性。因此,在不同的空间中,实体间的空间关系描述将会不同,进而将导致空间分析的结果产生很大的差异,因为大部分空间分析都是基于或涉及实体间的空间关系。

《3 空间实体的拓扑表达》

3 空间实体的拓扑表达

空间实体在GIS中是采用目标或场的方法表达的,与此相应的分别是矢量数据和栅格数据。矢量数据中的基本要素为点、线和面,而栅格数据则为像元。在矢量数据中,空间实体拓扑描述为点集内部、边界和外部。在现有的九元组模型中,对空间线、面实体的拓扑定义并没有考虑空间实体本身的维数及其所在空间的维数。如图 1 所示,图 1a 和图 1b分别为线实体在1维和2维空间的点集拓扑内部、边界和外部定义。

《图1》

图1 实体的拓扑概念

Fig.1 The topological concept of spatial entities

从图1可知,点集内部、边界和外部构成了拓扑空间的一个划分。但是,在图1a定义的线实体内部 L0 中的任意点 x 都存在一个邻域,,并使得,而图1b中定义的线实体内部不具有上述特性。因此,图1b中定义的拓扑概念是一种伪拓扑定义。显然,促使这种伪拓扑定义的主要原因是没有考虑空间实体的维数是否与其所处的空间的维数一致,如图 1 中线实体是 1 维的,当它处在 1 维空间时,根据“开集”这一概念定义的点集内部、边界和外部满足基本拓扑特性,即边界将内部和外部隔离(见图1a)。而当1维的线实体处在2维空间时,若利用在 1 维空间的拓扑定义则显然不能满足拓扑特性,图 1b 中线实体边界并没有将其内部与外部隔离。

从上述分析可知,在2维空间中,现有的九元组模型仅适合于用来区分面实体之间的拓扑空间关系,而要使其适合于描述所有类型实体(即点、线和面)间的拓扑空间关系,则必须重新定义2维空间中点、线实体的拓扑构成,即内部、边界和外部。

《4 拓扑空间关系描述的问题》

4 拓扑空间关系描述的问题

《4.1 九元组模型的不足》

4.1 九元组模型的不足

1)粗略分类。GIS的一个主要特点是着重于空间实体及其间相互关系的描述与表达,利用这种空间关系能够更便捷地实现空间查询、空间分析和数据挖掘,从数据库中提取用户所需信息。点集拓扑理论和图论[4~7] 是目前用得比较多的描述空间关系的理论基础,许多著名学者在此方面做了大量的研究工作,其中较为成熟的模型是Egenhofer提出的九元组模型(9-intersection model)[2] 。在九元组框架中,空间实体的外部为除去空间实体自身的所有2 维空间,那么空间实体 A 的外部与 B 的外部无论在何种情况下均有 A- ⋂ B- = ¬∅ 成立。此外,九元组的元素取值是基于二值逻辑 {∅,¬∅} 或 {0,1} ,严格意义上讲,是一种定性取值。在这些约束条件下,一定程度上减少了九元组描述的拓扑空间关系类型。此外,利用九元组描述的空间关系仅是一种定性描述,也就是说,这种空间关系描述是对现实空间世界中实体间关系的一种粗略分类,而不能更准确地描述。例如,图2中实体 AB 的关系,九元组都描述为相离关系。然而相比之下,图2a更接近相接关系(touch)。若实体 A 为采空区,实体 B 为村庄,显然图2a中采空区对村庄的影响要比图2b严重得多。

《图2》

图2 空间实体相离的两种情形

Fig.2 Two disjoint cases of spatial entities

再如,两条相交的线,一个交点的情形与多个交点的情形在九元组模型表达中是一致的,但是其拓扑关系与现实空间世界中实体并不同。针对上述现象,基于粗糙集理论则可发现,这种拓扑空间关系描述的不可区分性是由于拓扑关系分类粗糙所导致,也就是说,拓扑关系的分类信息颗粒偏大,从而使得上述两种拓扑关系成为等价类,即不可分辨。为此,Clemeniti 等利用维数扩展法对九元组进行了扩展,将交集的维数取值为Ø、0、1和2四种;邓敏[8] 等利用点集拓扑与度量相结合的方法来描述空间实体间的拓扑关系。总之,都是为了将拓扑关系的分类信息的颗粒变小,从而达到拓扑关系描述的精化。

2)容易受误差或不确定性的影响。从第3节中可知,在2维空间九元组模型仅适合于描述面实体间的拓扑空间关系。在此,根据拓扑空间的概念邻近,则可表达面实体间的8种拓扑空间关系(见图3)。

《图3》

图3 拓扑空间关系的概念邻域图

Fig.3 The neighborhood graph of topological spatial relations

图3中连线符号“-”表示两种空间关系可以直接相互转化。图中可以看出,空间实体间的拓扑空间关系变化具有连续性和有序性,例如,空间实体 AB 的关系从相离关系(disjoint)变化为叠置关系(overlap),则其中必然存在某一时刻或时段空间实体 A B 的关系为邻接关系(touch)。但是,在九元组模型下描述的拓扑空间关系仅是这种连续变化空间关系的离散表达,而不能体现空间关系连续变化的有序性以及变化的程度(即定量地刻画空间关系)。然而,GIS空间实体数据在空间实体抽象、概括和采集过程中不可避免地带有误差或不确定性[9~11] ,这种不确定性在九元组模型下将可能导致空间实体间拓扑关系描述的不确定性。因而,仅仅借助于九元组模型来描述空间实体间的空间关系对于GIS 空间查询、空间分析是不够的,获取信息的有效性将受质疑,甚至导致错误结果。

《4.2 与地理环境及地理空间认知的相关性》

4.2 与地理环境及地理空间认知的相关性

由于GIS研究的对象是地理实体,着重于地理实体间空间关系的描述。但是现有GIS描述的空间关系仅建立在数学空间中,与之相关的是地理实体的空间位置坐标及其间的拓扑、距离和方向等关系。然而,在地理空间中,由于地理实体的空间分布位置和所处的地理环境不同,上述在数学空间中的距离关系(也称度量关系)在地理空间中通常不能满足。同时,由于空间实体间的距离关系对其拓扑关系描述有较大的制约作用,这将导致在不同的空间有不同的拓扑关系描述。例如,在数学空间中通常认为空间实体间的邻近关系是相互的,即空间实体 AB 是邻近的,反过来,空间实体 BA 也是邻近的。这在地理空间中并不是总能成立的,如图4所示,虽然空间实体 AB 的距离在图中是一定的,但是,空间实体 B 并不是 A 的邻域,即空间实体 AB 并不是邻近关系,而空间实体 AB 的空间邻域内,即空间实体 BA 是邻近关系。实际中,空间实体 A 代表一个县,而 B 代表一个省,显然,与一个县为邻近关系的通常是其周围的一些县,而与省为邻近关系的则是周围的一些省。究其原因,这与人们对地理环境空间的理解、空间认知有密切关系,地理空间不同于“桌面空间(table-space)”,后者是一个完全可视的空间,而地理空间只是一个局部可视的空间,因此,在对地理空间中的地理实体及其间的关系进行空间分析时,则需涉及人们对地理空间信息的认知,即人们对事物的认识和描述过程中首先产生一个认知空间(cognitive space),并在认知空间中对事物进行理解和分析。显然,这种分析和描述过程需要建立地理信息的认知模型并将其纳入GIS中,才能更客观地进行地理空间分析。

《5 纳入度量特性的拓扑空间关系描述》

5 纳入度量特性的拓扑空间关系描述

从第4节中分析可知,现有的研究仅基于点集拓扑特性并利用九元组模型来描述空间实体间的拓扑关系是不够的,如图2中的两种分离关系,九元组模型并不能表达空间实体间的分离程度。而如图3中的拓扑关系分类描述容易受空间数据的误差影响,从而导致空间实体间拓扑关系描述的不确定性。为此,下面引入点集度量特性参数,并结合点集拓扑特性来描述空间实体间的拓扑关系。

虽然空间实体间的度量特性(如实体的面积、距离等)与空间实体间的拓扑关系描述没有直接关系,但是在某种程度上它又对空间实体间拓扑关系具有一定的约束作用,如图4中的邻近关系。因此,顾及点集的度量特性将能够更精确地描述空间实体间的拓扑关系。这里不妨以图3为例。图3表达的是将面实体间的拓扑空间关系离散化为 8 种情形,在一定程度上简化了拓扑空间关系的描述过程,即忽略了定量的变化,而仅强调定性的描述,这有利于在计算机中存储与表达。但是,由于表达客观实体的空间数据不可避免地带有误差或不确定性,并且这种误差或不确定性将随着GIS空间操作与分析(如常用的叠置操作)而传播,这必然影响到基于空间关系或空间关系与属性相结合的空间查询、空间分析所得结果的正确性。从点集拓扑学的角度可以解释,空间实体间的拓扑关系描述是基于两实体间点集边界、内部和外部的相互交集的取值不同来区分的,其中点集边界、内部和外部在几何上分别表示不同的物理意义,并具有一定的几何特性,而空间数据的误差或不确定性将直接导致空间实体的几何不确定性(也称图形不确定性),这使得用来表达点集边界的几何元素将是不确定的。同时,这种不确定性也将使得点集内部产生一个蠕动,即一部分元素可能属于点集内部,也可能不属于。然而,点集边界元素的不确定和内部的蠕动对于上述的拓扑关系离散化描述有时又是非常灵敏的,如图5所示。

《图4》

图4 地理空间中邻近关系不可逆性示例

Fig.4 The example of irreversibility neighboring relations of geospatial

《图5》

图5 容易受误差或不确定性影响的拓扑关系情形

Fig.5 The topological relationship cases affected by errors or uncertainties easily

《6 结语》

6 结语

1)地理实体间的空间关系描述与地理实体所在的地理空间位置、地理环境和地理空间本身的维数有关。

2)拓扑空间关系作为一种空间信息,为颗粒状结构。因此,拓扑空间关系描述的精确性与空间信息的颗粒大小有关,而引入点集度量特性在某种程度上细化了拓扑空间关系分类信息的颗粒。