欢迎来到天天文库
浏览记录
ID:36633296
大小:383.70 KB
页数:6页
时间:2019-05-13
《时序空间关联规则挖掘及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据2008年10月第6卷第5期地理空间信息GEOSPATIALINFORMA7FIONOct.,2008Vol-6.NO.5时序空问关联规则挖掘及其应用研究沙宗尧(武汉大学国际软件学院,湖北武汉430070)摘要:空间关联规则挖掘是空间数据挖掘的重要内容,文中给出了时序空间关联规则挖掘的相关概念、原理及实现(算法).研究了时序空间关联规则挖掘数据集的构造方法,提出通过空间实体关联关系和时间项转置方法将处于不同时刻的、相互独立的空间数据集进行重构,生成隐含了时序空间关联特征的挖掘数据集,进而可应用关联规则挖掘算法获取时序空间关联知识,初步进行了时序空间关联规
2、则挖掘的应用研究。关键词:空间数据挖掘:空间关联规则;时序关联;算法中图分类号:P208文献标志码:B文章编号:1672-4623(2008)05—0018一04Time--serialSpatialAssociationDataMiningandItsApplicationsSHAZongyao(InternationalSoftwareSchool,WuhanUniversity,Wuhan430079,China)Abstract:Spatialassociationdataminingisanimportantareaofspatialdataminin
3、g.Thispaperpresentedthebasicconcepts,principleandalgorithmoftime-serialspatialassociationdatamining.Byapplyingassociationrelationshipbetweenspatialentitiesanditem—timetransmitting,thedependentdatasetsatdifferencetimescouldbeintegratedintoanewdataset(N—dataset)whichcontainedthesequent
4、ialinformationoftheoriginaldatasets.Availableas—sociationruleminingalgorithmscouldbeeasilyappliedtotheN-datasettoextracttime-serialspatialassociationrules.Keywords:spatialdatamining;spatialassociationrule;timeserialassociation;algorithm信息社会的显著特点是数据量呈指数增加,传统的基于数据查询、简单数据统计的应用不能充分发掘这些数据
5、的内在价值。面对海量的数据资源,如何从中发现潜在的有用模式或知识,成为数据库技术与应用的重要领域——从数据库中发现知识(KnowledgeDiscoveryfromDatabases,KDD)或数据挖掘(DataMining)⋯“。随着空间信息技术特别是空间数据获取技术的飞速发展,空间数据库已成为很多应用领域的数据基础,通过空间数据挖掘或知识发现,可以从空间数据库中获取普遍的几何知识、空间分布规律、空间关联规则、空间聚类规则、空间演变规则,为充分利用空间数据资源提供有力武器D】【钔。在数据挖掘中,关联规则是最早被人们所注意并引入商业应用的研究领域之一,关联规则反
6、映了数据库中不同数据项间的关联性,通过挖掘关联规则,可以分析和理解数据库中不同数据项间的关联关系。空间关联规则反映了空间实体间的关联性(如方位关联、邻接关联、拓扑关联、距离关联、共生关联、包含关联等),空间关联规则挖掘是空间知识发现的一个重要内容,当空间数据库为时空数据库时,还可以把空间关联规则与时间维联系起来,挖掘带有时间约束条件的时序空间关联规则”1161。尽管目前在关联规则、时序关联规则的挖掘方面的研究已经较为深入,但对空间关联规则特别是当考虑到时序特征的空间关联规则挖掘的研究却较少,本文针对时序空间关联规则挖掘,给出相关原理、算法实现及应用。1概念、原理
7、与算法1.1关联规则与空间关联规则关联规则可以用以下数学模型加以描述:令I={屯f2,⋯,厶}是字母集,称为数据项,D。{D1,D2,⋯,Dn)是全体事务的集合。事务T是I的一个子集,即TCI,每个事务由唯一的标志TID标识。对数据项集XcI,称T包含X当且仅当X_T,关联规则具有如下形式:X_>Y,这里X_CI,Y_cI,且XnY=少,X称为规则的条件,Y称为规则的结果。规则x=>Y对集合D的置收稿日期:2008—03—25项目来源:教育部地理信息系统重点实验室开放资金资助项目(WD200610)。万方数据第6卷第5期沙宗尧:时序空间关联规则挖掘及其应用研究·
8、19·信度定义为D中c%
此文档下载收益归作者所有