基于globus决策树分类系统的研究和实现

基于globus决策树分类系统的研究和实现

ID:34701870

大小:2.38 MB

页数:67页

时间:2019-03-09

基于globus决策树分类系统的研究和实现_第1页
基于globus决策树分类系统的研究和实现_第2页
基于globus决策树分类系统的研究和实现_第3页
基于globus决策树分类系统的研究和实现_第4页
基于globus决策树分类系统的研究和实现_第5页
资源描述:

《基于globus决策树分类系统的研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文中文摘要摘要随着信息化程度的提高,在人类社会的各个领域聚集了大量甚至是海量的数据,数据挖掘就是要从这些数据中提取有用的信息,从上世纪80年代末以来人们对数据挖掘模型、算法、系统进行了大量的研究,并取得了一定的成果,为了提高算法的效率,并行和分布式数据挖掘一直是研究的重点,但面临很多挑战,比如:数据的海量、异构、分布、计算密集;知识表达形式不够丰富;挖掘工具和环境缺乏等,网格技术的出现在一定程度上为解决这些问题提供了帮助。CannataroMario提出下一代网格的研究应主要致

2、力于为用户提供知识服务。近年来,关于在网格上提供知识服务渐渐成为了研究的热点,并取得了很多重要成果,这些项目着重于在网格上实现知识发现服务的整体架构,而对利用网格服务来实现并行分布式数据挖掘算法很少提及,要在网格上进行知识发现,就不得不涉及到数据挖掘的算法,目前对可并行性算法利用网格服务来实现研究比较少。针对这种情况,论文采用网格系统中间件实现工具包GlobusToolkitVersion4按照网格服务的方式实现并行决策树分类算法SPRINT。采用该方式有以下优点:(1)扩展性好,因为采用网格服

3、务的方式实现,只须将算法相关的网格服务部署在参与计算的网格节点,增加参与计算的新节点较容易;(2)可复用,使用标准的网格服务,能很好的被其他网格应用集成;(3)充分利用网格资源,SPRINT算法固有的可并行性,在网格上实现该算法可以充分利用虚拟组织内的网格节点的计算能力,提高基于网格的知识发现服务速率。论文首先对数据挖掘相关概念及决策树分类算法进行介绍,详细分析了论文将要以网格服务的方式实现的并行决策树分类算法SPRINT。随后,论文对网格及网格计算相关内容进行简要介绍,对目前主流的几种网格体系

4、结构进行了详细分析,并对其中的五层沙漏结构和开放网格服务架构的优缺点进行了比较,并简要介绍分析了基于OGSA按照WSRF规范实现的网格中间件工具包GT4的各个功能部件。最后,采用GT4,按照网格服务的方式设计实现并行分布式决策树分类算法SPRINT,安装网格中间件GT4,组建了一个虚拟局域网格环境,通过数据集实例论证了论文提出的实现方式的有效性和可行性。关键词:数据挖掘,决策树,SPRINT,Globus,网格服务重庆大学硕士学位论文英文摘要ABSTRACTWiththedevelopmento

5、ftheinformationalpopularization,therelttl'ealotofdataassembledinvariousfieldsofOUrsociety.Data-miningisthemethodofpickingupefficientinformationfi'omthesedata.$ineo80soflastcentury,peoplehavecarriedoutplentyofresearchesaboutdata-miningmodels,algorithm

6、s,anddata-miningsystems.Andtosomeextent,theyhavegotsomeachievement.HowcveI',inordertoimprovetheetficieneyofalgorithm,parallelanddistributionaldata-mining,whicharealwaysregardedastheresearchimportance,躺confrontedwithmanychallenges,suchas.data'sabundan

7、ce,theirstructuraldi:ffercnce,theirdistribufion,theirealeulativodenseness,simpleknowledgeformula,andlackingofmininginsla'ttmentsandenvironment.ToS0111eextent,theemergenceof鲥dtechniqueoffersgreathelptosolvetheseproblems.AccordingtoCannataroMario,therc

8、scarelaofthenextgenerationof鲥dshouldbedevotedtoCOllSimlersinknowledgeSel'vicl嚣.Inrecentyears.itgraduanybeco邮hot,andpeoplehavealreadygotmanyachievements.Theseprojectshaveemphasizedrealizingthewholestructureofknowledgediscoveringservices,buthardlyhavem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。