网格环境中数据挖掘执行过程模型的研究

网格环境中数据挖掘执行过程模型的研究

ID:37400537

大小:10.62 MB

页数:240页

时间:2019-05-23

网格环境中数据挖掘执行过程模型的研究_第1页
网格环境中数据挖掘执行过程模型的研究_第2页
网格环境中数据挖掘执行过程模型的研究_第3页
网格环境中数据挖掘执行过程模型的研究_第4页
网格环境中数据挖掘执行过程模型的研究_第5页
资源描述:

《网格环境中数据挖掘执行过程模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、支宝京交博士学位论文网格环境中数据挖掘执行过程模型的研究ResearchonDataMiningExecutionProcessModelinGridEnvironments作者:张燕导师:孟洛明北京交通大学2011年12月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作

2、者签名:乡凌段签字日期:知,f年肛月2‘日导师签名:签字目期:2口//年,2月巧日中图分类号:TP311UDC:681.5.004北jI黜㈣京交通犬一学一博士学位论文网格环境中数据挖掘执行过程模型的研究ResearchonDataMiningExecutionProcessModelinGridEnvironments作者姓名:张燕导师姓名:孟洛明学位类别:工学学号:07112062职称:教授学位级别:博士学科专业:计算机科学与技术研究方向:基于网格的数据挖掘北京交通大学2011年12月致谢首先感谢导师孟洛明教授和刘峰教授在我工作、学习和生活等各个方

3、面给予的孜孜不倦的教诲和竭尽全力的支持。毕业论文能够顺利完成,与孟老师和刘老师的精心指导和严格要求分不开J孟老师和刘老师渊博的知识、丰富的阅历、高深的学术造诣、踏实勤奋的敬业精神和严谨求实的治学作风是我学习的榜样,更难能可贵的是导师高尚的人格情操和坦荡无私的胸怀,更令我终身敬仰。师恩深重,终生难忘,在此表示最衷心的感谢!在奥地利维也纳大学计算科学学院科学计算系进行为期16个月的合作研究期间,承蒙PeterBrezany教授的精心指导,以及AlexanderW6hrcr博士和IvanJan芒iak博士的的热心帮助,在本论文的立题和设计方面都给予了细致的

4、指导和宝贵的建议,不胜感激。本课题的研究受中国国家高技术研究发展计划《基于网格的铁路货运信息综合应用系统》(2006AA01A121)的大力资助,特此向项目组长邢智明主任、副组长李红辉老师致以深切的谢意。感谢网管中心的全体老师和学院的有关老师给予我的关心、支持、理解和帮助。感谢实验室的戴钢老师和路红英老师这几年来对我在科研和生活上的帮助。感谢实验室的同学们,肖俊、王春源、顾海泉、付嵘、李林卿、张永祥、郑继伟、张萌、赵婵婵,和大家在一起的时光轻松而愉快,这使得科研工作也充满了乐趣,再次衷心感谢大家的支持与帮助!感谢亲爱的爸爸、妈妈、姐姐、姐夫、桐桐多年

5、来一直在背后默默的支持和鼓励,使我才得以从这条艰辛的求学之路走下来!感谢我所有的亲人和朋友们,您们的支持和鼓励永远是我前行的动力。中文摘要摘要:随着信息技术的发展,大量数据在各种应用中被产生出来,并被分布的存储和积累在不同地点,如何从这些大量积累的、分布的数据中发现有用的、潜在的知识模式是一个极具挑战性的问题。网格技术用于在分布异构的资源间实现协作和共享,将数据挖掘技术运用于网格平台之上,为从大量分布的数据中获取有用的知识模式提供了有效的解决方案。但数据挖掘过程是一个涉及大量操作和数据的复杂过程,与网格平台相结合,无疑又增加了挖掘过程的复杂性。目前在

6、数据挖掘技术的研究中,数据挖掘算法被作为一个独立的整体,以黑盒的方式出现在应用中,在这种情况下,数据挖掘执行过程对用户和执行环境是不可见的,这使得集中式环境中的数据挖掘算法不能根据分布式环境的特点动态的转化为分布式的数据挖掘过程,用户不能灵活的对数据挖掘执行过程进行控制。此外,访问数据挖掘服务与访问网格服务的接口相互独立给用户访问网格中的数据挖掘服务带来不便。这些因素都导致了数据挖掘技术在网格平台上不能有效的发挥其作用。正如实际的铁路货运应用系统中需要解决的问题:在铁路货运网格平台的基础上,如何充分利用分布的计算资源,对分布在各个铁路局的货运数据进行

7、有效的深层次的挖掘以辅助决策。在本文提出的方法中,数据挖掘算法被分解成由细粒度数据挖掘操作组成的执行过程模型;在此基础之上,结合网格环境中数据资源和计算资源的分布情况,对模型进行优化,得到可以在网格中执行的分布式数据挖掘执行过程模型;然后,执行引擎将模型调度到各个网格节点执行;最后通过统一的、与网格平台相兼容的接口将数据挖掘结果提供给用户。本文在网格平台上,使用提出的方法实现了关联规则、序列模式、决策树分类器和朴素贝叶斯分类器等典型的数据挖掘执行过程模型的分解、优化与执行。本文的主要工作及创新点包括:·提出了由细粒度的数据挖掘操作组成的数据挖掘执行过

8、程模型,用于描述数据挖掘算法的执行过程,将数据挖掘算法白盒化。通过该模型,用户、应用程序和执行环境能清晰的理

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。