欢迎来到天天文库
浏览记录
ID:32969665
大小:2.03 MB
页数:79页
时间:2019-02-18
《webgis日志数据挖掘预处理的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、论文题目:WebGIS日志数据挖掘预处理的研究与实现工程领域:软件工程指导教师:曹宗杰副教授作者姓名:杨林红班学号:200991020402万方数据分类号密级UDC学位论文WebGIS日志数据挖掘预处理的研究与实现(题名和副题名)杨林红(作者姓名)指导教师姓名曹宗杰副教授电子科技大学成都储征伟研高江苏省国土资源厅南京(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业学位类别工程硕士工程领域名称软件工程提交论文日期2011.4论文答辩日期2011.5学位授予单位和日期电子科技大学答辩委员会主席评阅人2011年月日注1:注明《国际十进分类法UDC》的类号1万方数据独创
2、性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印
3、或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:年月日万方数据摘要摘要地理信息系统(GIS)作为一种国土资源信息化管理手段已经被越来越多的国土或矿产管理部门所认可和使用,借助地理信息系统,对国土资源的管理起到了事半功倍的效果,随着Internet的快速发展和普及,WebGIS应运而生。随着WebGIS站点建设规模的扩大和完善,站点客户访问量与日俱增,GIS服务的质量和安全等也面临严峻的考验。如何利用WebGIS网络上海量的数据更好地提供GIS服务,使GIS发挥更大的作用成了人们关注的焦点,WebGIS日志挖掘可以很好地解决这个
4、问题。WebGIS日志数据挖掘是将数据挖掘技术用于WebGIS服务器日志以获取用户的行为访问模式等有规律性的知识,从而改善WebGIS站点的组织结构和性能,提高站点的访问质量,进而实现个性化服务以及智能管理等,所以研究WebGIS日志数据挖掘具有重要的现实意义。在WebGIS日志数据挖掘中,数据预处理是非常重要的一个环节,它直接决定着挖掘算法的性能和挖掘结果的准确性。WebGIS日志预处理主要包括五个环节:数据清理、用户识别、会话识别、路径补充和事务识别。本文对WebGIS日志文件这种半结构数据的结构进行了具体分析,并采用编程的方法实现了将WebGIS日志文件导入到挖掘数据
5、库中,在这个基础上重点对WebGIS日志数据预处理的上述五个环节进行了深入的研究,详细阐述了各个环节实现的方法和用到的相关算法,比较全面地考虑了各个环节中的多种情况和条件,然后针对不同的情况采取了不同的策略来实现,在会话识别环节中,与以往的单个时间窗算法不同的是本文采用将两种时间窗算法相结合的两次时间分割方法来实现等等,这些工作很大程度上提高了挖掘数据的质量,进而提高了挖掘的准确度和效率,扩大了挖掘的适应范围。本文系统地整合说明了WebGIS日志数据挖掘的整个流程,并加以实现,最后设计开发出了WebGIS日志数据挖掘系统——WeblogMinier,由于本文主要涉及其中的数
6、据导入和数据预处理部分,所以只对这部分做详细的说明。关键词:WebGIS;日志数据挖掘;数据预处理;WebGIS日志数据挖掘系统;半结构化数据I万方数据ABSTRACTABSTRACTWiththerapiddevelopmentandpopularizationoftheInternet,thewebsiteisbecomemoreandmore,thenetworktrafficandthecomplexityofthewebstructureisalsodevelopmentatanalarmingrate.Followed,Networkdataandresourc
7、esshowexplosivegrowth.Howtohandleandusethemassofdatahasbecomeafocusofpeople'sattention,soWebLogMiningcameintobeinganddevelopmentintooneofthemostimportantpartofWebGISDataMining.WebGISLogMiningisanapplicationofDataMininginWebGISserverlogtoobtainthepatternandthea
此文档下载收益归作者所有