空间数据挖掘的若干理论与应用研究

空间数据挖掘的若干理论与应用研究

ID:32708773

大小:6.95 MB

页数:133页

时间:2019-02-14

空间数据挖掘的若干理论与应用研究_第1页
空间数据挖掘的若干理论与应用研究_第2页
空间数据挖掘的若干理论与应用研究_第3页
空间数据挖掘的若干理论与应用研究_第4页
空间数据挖掘的若干理论与应用研究_第5页
资源描述:

《空间数据挖掘的若干理论与应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海交通人学博士学位论文空间数据挖掘的若干理论与应用研究摘要空间数据挖掘,也称“从空间数据库中发现知识”,是指从空fnJ数据库中提取用户感兴趣的空间模式与特征、空间与非空问数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征。它可用于对空

2、.白j数据的理解,空间关系和空问与非空间数据问关系的发现,空间知识库的构造等等。空间数据挖掘在地理信息系统以及许多与空问数据相关的领域中有广泛的应用。本文以税务地理信息系统为大背景,开展了空间数据挖掘的若干理论与应用问题的研究,涵盖了空间聚类、空间分析、空fBJ矢n识表示与不确定性推理、空间关联规则和分类规则发现、数据预处理等主

3、要方面,重点放在空问数据与非空间(税务)数据普遍关系的提取。本文为一些空间数据挖掘算法的改进与实际应用做出了一定的贡献,主要包括以下内容:(1)研究和总结了空间数据模型、空fHJ数据库系统及其存取和查洵的一般结构。空间数据库系统集成了一些有利于改进查询性能的概念和技术,如空间存取结构、近似、对象分解及多步查询处理等。作为一种最重要的空问存取结构,R枣树是这些几何结构的基本组成部分。(2)对空间聚类算法,尤其是基于密度的空间聚类算法进行了研究。DBSCAN是一种优秀的基于密度的空1'8J聚类算法,但是当用于大型空间数据库聚类时,会造成巨大的I/O和内存花费。针对这一不

4、足,提出把代表性子集选择技术与DBSCAN算法结合起来,形成了两种基于代表性子集选择技术的DBSCAN算法。其中一种在DBSCAN内部引入代表性子集选择技术,另一种在DBSCAN外部使用了代表性子集选择算法。在大型空间数据库的聚类中,改进的算法大大提高了效率。(3)空M信息普遍存在模糊性、不确定性和不完备性,传统的一些方法不能有效地表示和处理各种空问信息。因此本文提出用语言云模型进行知识表示和不确定性处理,它较好地解决了空问知识表示以及概念层次的提升与自动生成等难题。进~步研究了基于概化的知识发现机制,这种机制集成了对于非空间数据的面向属性的归纳和对于空问数据的空帕

5、J合并与概化。将这种基于云模型的概化方法与经典的Apriori算法相结合,用于从一个实际的空问与税务数据库中挖掘空间关联规则,显上海交通大学博士学位论文示了这种新方法的有效性和适应性。(4)在空间分类问题与空1.日J决策支持的研究中,决策树是一个有力的工具。本文在将语言云模型用于知识表示和不确定性处理的基础之上,详细提出了准确地表达、测量、和把认知的不确定性结合进空间分类问题的知识推理过程,从而形成了一种全新的基于云模型的决策树(云决策树)。这种方法比较自然地刻画了人类思维和感知,具有以下优点:①云模型有效地结合随机性和模糊性,支持在空间分类问题中认识不确定性的表示

6、。②这种方法为决策者提供了更多的信息,例如规则的真实程度和分类的隶属度。③这种方法提取出来的空间分类规则更趋于自然,更加人性化,更容易让人理解。(5)针对距离关系的空间分析方法进行了研究,主要涉及网络分析中的最短路径问题、选址问题以及缓冲区分析等问题。进一步将一些理论成果在一个实际的税务地理信息系统中进行了成功的应用,是对税务系统空间分析与空间决策支持的非常有益的应用创新。(6)对数据预处理技术,尤其是主元分析方法进行了研究,针对传统的主元分析方法只能提取线性信息的不足,提出了一种基于径向基神经网络的非线性主元分析方法。这是一种有效的数据JK缩斤法,不仪提取了高维原

7、始数掘的线性信息还能提取非线性信息,训练速度快而且不会陷入局部最优。在此基础上提出应用这种方法进行数据样本中显著误差及劣点的检测,以利于对其进行剔除或是合理修正。综上所述,本文有如下几个主要创新点:(1)针对DBSCAN算法用于大型空间数据库聚类时会造成巨大的YO和内存花费的不足,提出了两种基于代表性子集选择技术的改进DBSCAN算法,提高了空问聚类的效率。(2)提出用语言云模型进行空间知识表示和概念层次的生成,形成了一种基于云模型和概化的空间关联规则挖掘的新方法。(3)提出了一套新的云决策树推理概念与方法,并成功应用于空间分类规则的提取。(4)提出了一利,基于神经

8、网络的非线性主元分析方法,改进了传统的主元分析方法,并应用于数值型(空间)数据的预处理过程。关键词:空I、日J数据挖掘,聚类,DBSCAN,空间知识表示,云模型,决策树,主元分析上海交通人学博士学位论文一———_——_—————————-————————————_—————_ResearchonUmptyTheoriesandApplicationsofSpatialDataMiningABSTRACTSpatialdatamining,i.e.,knowledgediscoveryinspatialdatabases,isthediscoveryofinter

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。