基于拓扑关系的gml空间面对象聚类算法分析

基于拓扑关系的gml空间面对象聚类算法分析

ID:33951867

大小:1.52 MB

页数:39页

时间:2019-03-02

基于拓扑关系的gml空间面对象聚类算法分析_第1页
基于拓扑关系的gml空间面对象聚类算法分析_第2页
基于拓扑关系的gml空间面对象聚类算法分析_第3页
基于拓扑关系的gml空间面对象聚类算法分析_第4页
基于拓扑关系的gml空间面对象聚类算法分析_第5页
资源描述:

《基于拓扑关系的gml空间面对象聚类算法分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第1章绪论面对象进行分析成了一个需要研究与解决的问题。目前空间聚类算法主要存在以下两个问题:一方面,空间聚类主要针对关系数据,随着Intemet的广泛应用,GML数据越来越多,面I句GML的空间聚类的研究却很少;另一方面,没有考虑空间拓扑关系的相似性,而空间对象间的拓扑关系是指两个空间目标在拓扑变换(如放缩、旋转)下保持不变的空间关系,是空间对象的固有属性,因此目前对GML数据进行空间聚类研究,并考虑空间拓扑关系的相似性具有重要意义。本文将在国家自然科学基金项目(40871176)的资助下研究下列问题:(1)如何针

2、对GML存储的空间数据,以面对象为核心进行拓扑关系的计算;(2)如何高效地对基于拓扑关系的GML空间面对象进行聚类,发现空间面对象中的分布规律。1.2研究现状空间关系【6】是指地理实体之间存在的一些具有空间特性的关系,如拓扑关系m、距离关系【8】、方向关系【91等,是空间数据组织、查询、分析、推理的基础。空间关系理论及其研究直接影响着GIS系统的设计、开发和应用,受到了国际GIS及相关学术界的高度重视。而空间分析fl01,在某种程度上正是处理这种空间实体之间的相互关系一一空间关系,美国UCGIS曾在1998年把空间

3、分析列为GIS界十大重点问题之一,这主要源于它对现实的巨大指导作用。空间拓扑分析【ll】是空间分析的主要内容,也是GIS和空间数据库的关键技术,现实中的应用非常广泛。空间拓扑关系的形式化描述是建立在点集拓扑理论基础【l2】之上的。这里我们主要针对面对象,讨论二维空间中的拓扑关系,包括点一面、线一面、面一面等。而每一种形式的空间关系有多种,这里我们只讨论包含、相交、相邻关系。目前,对于包含关系的判断【13’141,国内外学者已提出了很多算法,如射线法【15’16】及其改进算法【17,18】、夹角和法【191、拓扑映射

4、法[20,21】、基于链码和特征形的方法【221等。射线法的基本思想是从欲判断的点向面作一条射线,求出其与面边界的交点个数,从而得出点在面内(外)。夹角和法的基本思想是连接判断点与面的各顶点,计算其夹角和,其中顺时针方向为正,逆时针方向为负。若夹角和为2万,则点在多边形内:若夹角和为0,则点在多边形外。夹角和法适用于凹、凸多边形,有孔的多边形除外。拓扑映射法则只适用于凸多边形,它将点在凸多边形内外的判断转化为映射点在射影直线上的位置关系问题。对于相交关系的判断可以用混合积的方法【23l,也可以使用参数化向量的方法【

5、24】。对于相邻关系的判断可以用距离来度量,但是当对面对象使用距离来度量时,首先需通过空间近似方法(如2第1章绪论点近似、最小外接矩形近似),但它们的近似质量不高,计算出的距离总有一定误差。而判断点、线、面的包含、相交、相邻关系是空间拓扑分析中的重要组成部分。例如,在GIS空问查询中,要求列出给定面内的所有空间对象,这时就必须计算空问对象间的包含关系。因此,研究这一问题的快速算法具有实际的应用价值。空间聚类分析是空间模式识别和空间数据挖掘的重要手段之一。国内外研究者已经提出了多种空间聚类算法,例如,DBSCAN算法

6、【25】是一个基于密度的空间聚类算法,用来发现带有噪声的空问数据库中任意形状的聚类。该算法的效率较高,但算法执行前需输入阈值参数,且它仅能对点进行聚类。GDBSCAN算法【26】对DBSCAN算法进行了推广,它不仅能对点进行聚类,也能对线或面进行聚类。可以看出,这些空间聚类算法主要针对欧几何空间中的数据对象。然而空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。文献127]提出了一种基于密度的空间聚类的一般观点一一拓扑聚类,它针对基于密度的空间聚类及其变种引入了拓扑的概念,给出了聚类拓扑

7、结构的定义,把簇定义为多种类型的拓扑型关联集合,但它仅能对点进行聚类,并未涉及线、面等空间对象。然而,一方面,目前空间聚类分析只针对关系数据,但在GIS中,通常使用GML来表达地理信息,而GML是半结构化数据,因此,研究GML的空间聚类算法具有理论意义和应用价值。另一方面,目前空间聚类分析方法存在着两个偏向,一是从事GIS理论方法和技术工具研究的工作者大多根据空间对象的地理坐标进行聚类,即只考虑对象的空间邻近性,而不考虑对象的属性特征的相似性;另一种是从事GIS应用和地学研究的工作者,则直接套用传统聚类分析方法,根

8、据属性特征集进行分析,而忽视了对象的空间邻近性。空间对象本质上具有地理位置和属性特征双重含义,二者结合才能完整地描述空间特征和空间差异。将空间拓扑关系和属性特征纳入统一的空间距离测度和空间聚类分析系统,将会改善空间分析和空间数据挖掘的信息质量。空间数据与传统数据相比,具有自己独特的特点。表现在两个方面:一是空间数据都与某一对象相关,空间数据中除包含以文字、字

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。